Anthropicu vendos rregulla të reja për ndërprerjen e bisedave të dëmshme

Kompania Anthropic ka prezantuar funksione të reja tek disa modele Claude, duke i lejuar ato të mbyllin bisedat në raste ekstreme të ndërveprimeve të dëmshme ose abuzive.

Sipas njoftimit, ky funksion nuk është krijuar për të mbrojtur përdoruesit, por vetë modelet. Anthropic thekson se nuk i konsideron inteligjencat artificiale si qenie të ndjeshme, por po aplikon masa parandaluese “për çdo rast,” duke hulumtuar konceptin e ashtuquajtur “mirëqenie e modelit.”

Këto ndryshime janë aktualisht të kufizuara tek Claude Opus 4 dhe 4.1 dhe do të aplikohen vetëm në situata ekstreme. Ndër rastet e përmendura janë kërkesa për përmbajtje të paligjshme me të mitur apo tentativa për të marrë informacione që mund të përdoren për dhunë masive ose akte terroriste.

Në testimet para lëshimit, modelet e reja shfaqën një refuzim të fortë ndaj këtyre kërkesave, madje edhe shenja që kompania i interpreton si “distres i dukshëm.” Sipas Anthropic, ndërprerja e bisedës do të jetë gjithmonë mjeti i fundit, vetëm pasi përpjekjet e shumta për devijim të dështojnë ose kur vetë përdoruesi kërkon mbylljen e dialogut.

Megjithatë, kompania thekson se kjo aftësi nuk do të përdoret në situata ku përdoruesit mund të jenë në rrezik për t’i bërë dëm vetes apo të tjerëve. Në ato raste, modelet do të vazhdojnë të përpiqen të ofrojnë mbështetje dhe orientim.

Nëse një bisedë ndërpritet, përdoruesi do të ketë ende mundësinë të hapë një dialog të ri nga llogaria e tij ose të krijojë degëzime të reja nga biseda problematike duke redaktuar përgjigjet. Anthropic e konsideron këtë funksion një eksperiment në vazhdim dhe synon ta përmirësojë në bazë të përvojës dhe reagimeve.

Ky hap tregon një qasje të pazakontë në industrinë e inteligjencës artificiale, ku vëmendja nuk përqendrohet vetëm tek mbrojtja e njeriut, por edhe tek mënyra se si ndërveprimet mund të ndikojnë mbi vetë modelet.

Bizneset që reklamohen në rrjetin e TV Apollon

Bëj edhe ti publicitet në TV Apollon

Tel: +355 69 27 56 610

Tel: +355 69 51 27 033