Китайський стартап DeepSeek стрімко набирає популярність після того, як його ШІ-асистент очолив рейтинг безкоштовних застосунків в американському App Store, випередивши ChatGPT. Це викликало дискусії щодо ефективності експортних обмежень США на передові AI-чіпи для Китаю.
Що таке DeepSeek?
DeepSeek — китайська компанія, заснована у 2023 році, яка спеціалізується на розробці штучного інтелекту. Її засновник, Лян Веньфен, раніше був пов'язаний з хедж-фондом High-Flyer, одним із найбільших кількісних фондів у Китаї. DeepSeek зосереджується на створенні фундаментальних AI-технологій і відкрито публікує свої моделі з відкритим кодом.
Розвиток моделей DeepSeek
У листопаді 2023 року компанія представила свою першу модель — DeepSeek Coder, доступну безкоштовно для дослідників і комерційних користувачів. Код моделі був опублікований з відкритою ліцензією MIT.
У грудні 2024 року DeepSeek випустила модель DeepSeek-V3 з 671 мільярдом параметрів, яка була натренована за 55 днів із витратами близько $5,58 мільйона. Модель показала конкурентоспроможність із GPT-4 та іншими провідними AI-моделями, незважаючи на обмеження США на постачання передових чіпів до Китаю.
Висновок
Швидке зростання популярності DeepSeek демонструє здатність китайських компаній розробляти передові AI-технології, навіть в умовах експортних обмежень. Це підкреслює необхідність глобального співробітництва та обміну знаннями у сфері штучного інтелекту.
Більше новин про технології читайте на нашому каналі: Tech Today UA.