ШІ, Web3, Інновації

GTP-4o - нові можливості від OpenAI

15 травня 5 хв читати

Зміст

Коротко про можливості нової моделі
Оцінка моделі GPT-4o
Основні тези з безпеки GPT-4o
- Основні джерела інформації

OpenAI анонсували нову флагманську модель GPT-4o, яка може міркувати між аудіо, відео та текстом у реальному часі.

Коротко про можливості нової моделі

GPT-4o, де “o” ( for “omni”, означає "всеосяжний"), - це значний крок до більш природної взаємодії людини з комп'ютером. Ця модель може сприймати й обробляти інформацію у різних форматах: текст, аудіо, зображення та відео, а також генерувати відповіді у будь-якому з цих форматів.

Швидкість вражає: GPT-4o реагує на аудіозапити всього за 232 мілісекунди в середньому, що практично дорівнює швидкості реакції людини.

Покращена продуктивність: GPT-4o демонструє таку ж продуктивність, як і GPT-4 Turbo, що стосується обробки англійського тексту та коду. При цьому вона значно краща в обробці тексту на інших мовах.

Доступність: GPT-4o не лише потужніша, але й економніша. Її API на 50% дешевше, ніж API GPT-4 Turbo.

Особливі здібності: GPT-4o має значно кращі, ніж у попередніх моделей, можливості розуміння візуальної та аудіоінформації.

Дві GPT-4o взаємодіють між собою

Переклад у реальному часу

Колискові та демонстрація шепоту

Конференція разом з GPT-4o

Сарказм від GPT-4o

Математичні задачі

Вивчення іспанської за допомогою GPT-4o

Гра камінь ножиці папір з GPT-4o

Гармонія з двома GPT-4o

Підготовка до співбесіди

Зустріч GPT-4o з собакою

Доступність "Будь моїми очима" GPT-4o

Привітання з днем народження

GPT-4o оцінює жарт

Підрахунок з GPT-4o

Демонстрація розмовної мови GPT-4o в реальному часі

Демонстрація варіацій голосу GPT4-o

Можливостей технічного зору GPT-4o в реальному часі

Демонстрація асистента кодування GPT-4o та десктопної програми

Переклад GPT-4o в реальному часі

Можливостей технічного зору GPT-4o в реальному часі

Оцінка моделі GPT-4o

За результатами тестування на стандартних оцінювальних показниках, GPT-4o демонструє рівень продуктивності, аналогічний GPT-4 Turbo, що стосується обробки тексту, логічного міркування та розуміння коду. Водночас, GPT-4o встановлює нові рекорди за своїми можливостями працювати з багатомовними текстами, аудіо та візуальною інформацією.

Оцінка тексту

***Покращене міркування*** - GPT-4o показав новий високий результат 88,7% на тест COT MMLU (питання на загальні знання) з нульовою відповіддю. Всі ці оцінки були зібрані за допомогою нашої нової бібліотеки *simple evals* (відкриється в новому вікні). Крім того, на традиційному 5-ти пострільному тесті без COT MMLU GPT-4o показав новий високий результат 87,2%. (Примітка: *Llama3* *400b(відкриється в новому вікні) все ще тренується)*

Ефективність аудіо ASR

***Продуктивність аудіо ASR*** - GPT-4o значно покращує продуктивність розпізнавання мовлення порівняно з Whisper-v3 для всіх мов, особливо для мов з низьким рівнем ресурсів.

Ефективність аудіоперекладу

Результати нульового тесту M3Exam

***M3Exam*** - Оцінка M3Exam є багатомовним і візуальним оцінюванням, що складається з питань з множинним вибором зі стандартизованих тестів інших країн, які іноді містять фігури та діаграми. GPT-4o перевершує GPT-4 за цим показником для всіх мов. (Результати перевірки зору для суахілі та яванської не враховуються, оскільки для цих мов є лише 5 або менше питань із перевірки зору.)

Оцінки розуміння тексту зоровим аналізатором

***Оцінювання розуміння зображень*** - GPT-4o демонструє найкращі на сьогоднішній день результати за показниками візуального сприйняття. Усі оцінювання зору проводяться без попереднього навчання (zero-shot), при цьому MMMU, MathVista та ChartQA є завданнями CoT без попереднього навчання.

Основні тези з безпеки GPT-4o

Вбудована безпека: GPT-4o розроблена з урахуванням безпеки на всіх рівнях, включаючи фільтрацію даних, налаштування поведінки моделі та нові системи безпеки для голосових функцій.
Оцінка ризиків: Незалежна оцінка показала, що GPT-4o несе середній рівень ризику за кібербезпекою, ХБРЯ, переконанням та автономією моделі.
Зовнішнє тестування: Розширене тестування з залученням понад 70 експертів допомогло виявити та пом'якшити потенційні ризики.
Контрольоване впровадження аудіоможливостей: Аудіофункції будуть випущені пізніше з обмеженими голосами та суворим дотриманням політик безпеки.
Відомі обмеження: GPT-4o, як і будь-яка модель машинного навчання, має певні обмеження, які будуть детально описані в документації.
Постійне вдосконалення: Ми прагнемо постійно вдосконалювати безпеку GPT-4o, виявляючи та усуваючи ризики в міру їх виникнення.

GPT-4o - це нова модель штучного інтелекту, яка відкриває нові горизонти для взаємодії людини з комп'ютером. Її швидкість, універсальність та доступність роблять її цінним інструментом для широкого кола завдань.

Основні джерела інформації

https://openai.com/

Наука Chat Gpt Ai Штучний Інтелект Gpt-4o

Статті про вітчизняний бізнес та цікавих людей:

Lullaby@lullaby.ua
Mantle: розбір шведського бренду активного догляду за обличчям і як зорієнтуватися в лінійці
Mantle вирізняється підходом, рідкісним для догляду за обличчям: замість звичного «anti-age» він говорить про здоров'я шкіри – її бар'єр, рівний тон і сяйво.
Дата публікації: учораЧас на прочитання: 5 хв читати
Теми цього довгочиту:
Mantle
UCloud@ucloud_ua
Хмарні сервіси та їх використання | UCloud
Хмарні сервіси: збереження даних, трансляції, бізнес-програми та освіта. Дізнайтесь, де застосовують хмарні сервіси та як обрати їх для бізнесу.
Дата публікації: 6 дн. томуЧас на прочитання: 4 хв читати
Теми цього довгочиту:
Хмарні Сервіси
Design Print UA@designprintua
Як паковання впливає на сприйняття бренду
Паковання давно перестало бути лише способом перенести або захистити товар. Для бізнесу це частина першого контакту з клієнтом: ще до того, як людина оцінить сам продукт, вона вже бачить матеріал, форму, якість друку та загальну подачу.
Дата публікації: 7 липняЧас на прочитання: 3 хв читати
Теми цього довгочиту:
Виготовлення Упаковки
Л
Леруа@leroymerlin.ua
Розкладний садовий стілець: огляд варіантів від «ЛЕРУА МЕРЛЕН» для дачі та тераси
Мобільні розкладні стільці — елемент комфортного відпочинку на відкритій дачній ділянці, терасі, патіо, в альтанці тощо. На відміну від стаціонарних крісел і диванів, це меблі, які легко переносити з місця на місце, ховати в приміщенні від дощу і брати з собою на заміські пікніки
Дата публікації: 3 липняЧас на прочитання: 4 хв читати
Теми цього довгочиту:
Садові Меблі
Kreisel UA@kreisel
Завод у Фастові: як КРАЙЗЕЛЬ будує українське виробництво світової якості?
Завод німецької компанії КРАЙЗЕЛЬ у Фастові функціонує за суворими німецькими стандартами, випускаючи продукцію з високими експлуатаційними характеристиками і стабільною європейською якістю
Дата публікації: 1 липняЧас на прочитання: 3 хв читати
Теми цього довгочиту:
Будматеріали

Поділись своїми ідеями в новій публікації.
Ми чекаємо саме на твій довгочит!

Написати

Технологічний ритм@TechRhythm

ШІ, Web3, Інновації

13Довгочити

24.5KПерегляди

18Підписники

Підтримати

На Друкарні з 6 квітня 2024

Більше від автора

Meshy-4 GenAI для 3D-моделювання та дизайну.
Стартап Meshy що спеціалізується у сфері дизайну зі ШІ випустив Meshy-4 — новий інструмент для 3D-моделювання на базі штучного інтелекту.
Дата публікації: 27 серпняЧас на прочитання: 4 хв читати
Теми цього довгочиту:
Штучний Інтелект
Ideogram & Midjorney [Оновлення]
Нещодавно вийшли оновлення для таких інструментів генеративного штучного інтелекту, як Midjourney та Ideogram — двох дуже популярних ШІ для генерації зображень, які використовуються в різних галузях.
Дата публікації: 24 серпняЧас на прочитання: 4 хв читати
Теми цього довгочиту:
Ші
Платформа Gen AI від Exists для створення 3d -ігор за допомогою підказок
AI-стартап Exists створив платформу на основі генеративного ШІ, яка дозволяє створювати 3D-ігри за допомогою текстових підказок. Це надає можливість будь-кому розробляти високоякісні 3D-проєкти для ігрової індустрії за лічені хвилини
Дата публікації: 20 серпняЧас на прочитання: 4 хв читати
Теми цього довгочиту:
Ші

Це також може зацікавити:

Yota-x.com@Yota_X
ChatGPT та його вплив на роботу користувача та взаємодію людини з комп’ютером (UX та HCI)
Як штучний інтелект вже зараз допомагає нам краще проектувати інтерфейси
Дата публікації: 28 квітняЧас на прочитання: 5 хв читати
Теми цього довгочиту:
Ux
Останній Капіталіст@OstanniyCapitalist
Big Tech компанії перебувають в погоні за тренувальними даними для ШІ
Big tech компанії перебувають у пошуках легального способу отримати данні для навчання ШІ, на допомогу їм приходять давно забуті сайти для фотографій.
Дата публікації: 19 травняЧас на прочитання: 6 хв читати
Теми цього довгочиту:
Технології
Максим Валін@MaksymValin
Кіт Шредінгера на мікросхемі: як вчені керують долею квантових часток.
У квантовій фізиці можливо існувати в двох станах одночасно — бути і живим, і мертвим. Цей дивовижний принцип став відомий завдяки Ервіну Шредінгеру та його уявному котику.
Дата публікації: 19 грудняЧас на прочитання: 8 хв читати
Теми цього довгочиту:
Наука

Meshy-4 GenAI для 3D-моделювання та дизайну.

Теми цього довгочиту:

Ideogram & Midjorney [Оновлення]

Теми цього довгочиту:

Платформа Gen AI від Exists для створення 3d -ігор за допомогою підказок

Теми цього довгочиту:

Коротко про можливості нової моделі

Дві GPT-4o взаємодіють між собою

Переклад у реальному часу

Колискові та демонстрація шепоту

Конференція разом з GPT-4o

Сарказм від GPT-4o

Математичні задачі

Вивчення іспанської за допомогою GPT-4o

Гра камінь ножиці папір з GPT-4o

Гармонія з двома GPT-4o

Підготовка до співбесіди

Зустріч GPT-4o з собакою

Доступність "Будь моїми очима" GPT-4o

Привітання з днем народження

GPT-4o оцінює жарт

Підрахунок з GPT-4o

Демонстрація розмовної мови GPT-4o в реальному часі

Демонстрація варіацій голосу GPT4-o

Можливостей технічного зору GPT-4o в реальному часі

Демонстрація асистента кодування GPT-4o та десктопної програми

Переклад GPT-4o в реальному часі

Можливостей технічного зору GPT-4o в реальному часі

Оцінка моделі GPT-4o

Оцінка тексту

Ефективність аудіо ASR

Ефективність аудіоперекладу

Результати нульового тесту M3Exam

Оцінки розуміння тексту зоровим аналізатором

Основні тези з безпеки GPT-4o

Основні джерела інформації

Статті про вітчизняний бізнес та цікавих людей:

Mantle: розбір шведського бренду активного догляду за обличчям і як зорієнтуватися в лінійці

Теми цього довгочиту:

Хмарні сервіси та їх використання | UCloud

Теми цього довгочиту:

Як паковання впливає на сприйняття бренду

Теми цього довгочиту:

Розкладний садовий стілець: огляд варіантів від «ЛЕРУА МЕРЛЕН» для дачі та тераси

Теми цього довгочиту:

Завод у Фастові: як КРАЙЗЕЛЬ будує українське виробництво світової якості?

Теми цього довгочиту:

Більше від автора

Meshy-4 GenAI для 3D-моделювання та дизайну.

Теми цього довгочиту:

Ideogram & Midjorney [Оновлення]

Теми цього довгочиту:

Платформа Gen AI від Exists для створення 3d -ігор за допомогою підказок

Теми цього довгочиту:

Це також може зацікавити:

ChatGPT та його вплив на роботу користувача та взаємодію людини з комп’ютером (UX та HCI)

Теми цього довгочиту:

Big Tech компанії перебувають в погоні за тренувальними даними для ШІ

Теми цього довгочиту:

Кіт Шредінгера на мікросхемі: як вчені керують долею квантових часток.

Теми цього довгочиту:

Коментарі (0)

Це також може зацікавити:

ChatGPT та його вплив на роботу користувача та взаємодію людини з комп’ютером (UX та HCI)

Теми цього довгочиту:

Big Tech компанії перебувають в погоні за тренувальними даними для ШІ

Теми цього довгочиту:

Кіт Шредінгера на мікросхемі: як вчені керують долею квантових часток.

Теми цього довгочиту: