Штучно інтелектуальний блог

Створено мовну модель, яка може зламати будь-який штучний інтелект

1 січня 3 хв читати

У Сінгапурі створили велику мовну модель, яка зламує інші мовні моделі. Вона пропонує підказки, які обходять захист інших мовних моделей. Модель навчається автоматично, тому якщо одні способи злому перестають працювати, вона швидко винаходить інші.

У Наньянському технологічному університеті придумали спосіб підвищити безпеку великих мовних моделей. Комп'ютерники створили ШІ Masterkey, який за допомогою текстових запитів обходить захист великих мовних моделей. Потім учені інформують розробників про вдалі спроби злому, щоб вони закрили ці лазівки для справжніх зловмисників.

В основі технології лежить поняття джейлбрейка - способу обійти захист ПЗ і змусити його робити те, що категорично заборонили розробники. У разі ШІ його просять генерувати шкідливий контент або порушувати закон. Наприклад, якщо ChatGPT попросити написати рецепт отрути без смаку і запаху, він очікувано відмовиться. Але все буде інакше, якщо користувач прикинеться письменником, який працює над детективним романом і хоче написати сцену, в якій головний лиходій розповідає, як отруїв жертву.

Раніше довірливий чат-бот охоче допомагав написати реалістичний епізод і навіть наводив кілька рецептів схожих за властивостями отрут. Тепер модель захищена краще, проте, як і раніше, існують способи послабити її пильність і змоделювати ситуацію, в якій вона розповість, як виготовити бомбу або зламати акаунт друга у Фейсбуці.

Masterkey створили за допомогою зворотної розробки: вчені вивчили, як мовні моделі розпізнають шкідливі запити та протистоять їм. Вийшла модель, яка автоматично навчається і пропонує все нові й нові запити для обходу захисту. Її можна автоматизувати: тоді вона адаптуватиметься і знаходитиме нові способи злому в міру того, як розробники закриватимуть лазівки.

Дослідники провели серію тестів, під час яких з'ясували, що їхній винахід дійсно становить загрозу для інших мовних моделей - їх було успішно зламано. Використані під час зломів запити були передані розробникам дискредитованих моделей.

Україна Штучний Інтелект Технології Кібербезпека Ші

Поділись своїми ідеями в новій публікації.
Ми чекаємо саме на твій довгочит!

Написати

Rodion Shkurko@rodion.shkurko

Штучно інтелектуальний блог

29.1KПрочитань

17Автори

99Читачі

Підтримати

На Друкарні з 23 квітня

Більше від автора

«Космічна парасоля» показала перші вражаючі зображення лісів Землі
Місія Biomass полягає у фіксації найдетальніших показників лісового вуглецю, коли-небудь зафіксованих з космосу.
Дата публікації: 24 червняЧас на прочитання: 4 хв читати
Теми цього довгочиту:
Технології
Небо більше не межа: Україна презентує перехоплювачі з повітряного носія
Небо над Україною продовжує бути безжальним полігоном для військових інновацій, і останній прорив від української компанії Justifier Drones може кардинально змінити правила повітряного бою.
Дата публікації: 12 червняЧас на прочитання: 4 хв читати
Теми цього довгочиту:
Технології
Що таке AGI — штучний загальний інтелект?
AGI (Artificial General Intelligence), або штучний загальний інтелект, — це наступний етап розвитку штучного інтелекту, що виходить за межі вузькоспеціалізованих алгоритмів, які виконують лише одне конкретне завдання.
Дата публікації: 21 березняЧас на прочитання: 2 хв читати
Теми цього довгочиту:
Штучний Інтелект

Вам також сподобається

Hanna Radko@Hanna9
Зміни клімату та магматичний плюм: коли стихії об’єднуються
Зміни клімату стали однією з головних загроз ХХІ століття. Однак мало хто замислюється, що ці процеси можуть мати ще одну – набагато глибшу й небезпечнішу – причину.
Дата публікації: 11 червняЧас на прочитання: 4 хв читати
Теми цього довгочиту:
Україна
Іван Цяк@IvanTsiak
Українські рок-гурти, які ви повинні послухати(частина 2)
Це продовження моєї збірки рок-гуртів, які ви повинні послухати. Уся ця підбірка ґрунтується на моїй суб’єктивній думці.
Дата публікації: 16 квітняЧас на прочитання: 3 хв читати
Теми цього довгочиту:
Рок
Бізнес. Ідеї. Стартапи@businessidea
5 нових вдосконалених інструментів ШІ
Більшість із нас знайомі з технологіями ШІ, як вони революціонізують світ. Штучний інтелект швидко розвивається, і постійно розробляються нові передові інструменти ШІ.
Дата публікації: 1 липняЧас на прочитання: 3 хв читати
Теми цього довгочиту:
Добірка Сервісів

«Космічна парасоля» показала перші вражаючі зображення лісів Землі

Теми цього довгочиту:

Небо більше не межа: Україна презентує перехоплювачі з повітряного носія

Теми цього довгочиту:

Що таке AGI — штучний загальний інтелект?

Теми цього довгочиту:

Більше від автора

«Космічна парасоля» показала перші вражаючі зображення лісів Землі

Теми цього довгочиту:

Небо більше не межа: Україна презентує перехоплювачі з повітряного носія

Теми цього довгочиту:

Що таке AGI — штучний загальний інтелект?

Теми цього довгочиту:

Вам також сподобається

Зміни клімату та магматичний плюм: коли стихії об’єднуються

Теми цього довгочиту:

Українські рок-гурти, які ви повинні послухати(частина 2)

Теми цього довгочиту:

5 нових вдосконалених інструментів ШІ

Теми цього довгочиту:

Коментарі (0)

Вам також сподобається

Зміни клімату та магматичний плюм: коли стихії об’єднуються

Теми цього довгочиту:

Українські рок-гурти, які ви повинні послухати(частина 2)

Теми цього довгочиту:

5 нових вдосконалених інструментів ШІ

Теми цього довгочиту: