Як ChatGPT веде за мене канал в Telegram і у нього це (майже) виходить — Частина 2

14 квітня 9 хв читати

Зміст

Передмова
Воно живе (на перший погляд)
Систематизація проблем
Красива, але безглузда маячня
Займенники
Поганий переклад українською
Технічні проблеми
Фінальний алгоритм (спрощено)
Підсумки

Передмова

Щоб розуміти, про що тут написано, бажано спочатку прочитати першу частину.

Воно живе (на перший погляд)

Після заповнення бази даних репозиторіями та їх описами, згенерованими ChatGPT, почали автоматично публікуватися перші пости в Telegram канал. Тексти були написані непогано, хоч і дещо неоковирно, але менше з тим, перша проблема, яку я помітив, полягала в тому, що текст іноді не відповідав реальному опису репозиторія. Схоже, що AI додавав деякі вигадані деталі, які не відповідали реальному опису. Після огляду інших записів в базі даних я зрозумів причину: ChatGPT не міг переходити за деякими посиланнями, і тому генерував описи на основі слів у посиланні або своїх власних знань. Наприклад, цей репозиторій містить проєкт, який перетворює код Python у машинний код, але AI описав його так:

🧬 Codon - це пакет Python, який надає інструменти для аналізу та візуалізації послідовностей ДНК та РНК. Він містить функції для перекладу послідовностей в послідовності амінокислот, ідентифікації відкритих рамок зчитування та обчислення статистики використання кодонів. Пакет також містить кілька інструментів візуалізації, таких як теплові карти та діаграми розсіювання, для дослідження патернів використання кодонів.

Звучить досить круто, шкода що це неправда, хоча мабуть десь на теренах сайту GitHub дійсно існує такий проєкт. А ще за декілька днів роботи бот пару раз впав, переклад тексту був інколи поганий, і я вирішив описати всі проблеми та починати полірувати бота до блиску, або хоча б до невеличкого сяйва.

Систематизація проблем

AI іноді генерує красиві, але безглузді тексти, які не відповідають реальному опису репозиторія.
Згенеровані тексти іноді написані від імені автора Telegram каналу або власника репозиторія, наприклад "Хочу вам представити свій проєкт" або "Наш веб додаток пропонує".
Переклад тексту українською іноді дуже поганий, не тому, що містить багато граматичних помилок, а тому, що перекладаються навіть технічні терміни та назви проєктів.
ChatGPT може бути іноді не доступним, а тому він не зможе згенерувати тексти.
Сайт GitHub також може бути іноді недоступним, це буває не часто, але це також треба врахувати.

Здавалось би, не дуже багато, та й останній два пункти - це виключно технічні проблеми, які можна легко виправити, але завжди є але. Тому давайте більш детально заглибимося в проблеми та мої спроби їх вирішити.

Красива, але безглузда маячня

Після детального дослідження офіційної документації та спілкування з ChatGPT я зрозумів, що він може "переходити" за посиланнями, але його база даних обмежена вереснем 2021 року, тому він не володіє даними про репозиторії, що з'явилися пізніше, і генерує текст на основі наявних даних або просто щось вигадує. А ще я хотів, щоб ChatGPT сам розміщував емодзі по тексту, вставляв посилання на проєкт, і взагалі писав текст якось прикольно. Проте, при явному зазначені цих параметрів у запиті, емодзі розміщувалися хаотично та іноді навіть повторювались декілька раз підряд, посилання на проєкт іноді не вставлялися, а сам текст був низької якості. Я вирішив модифікувати запит.

Завдяки боту я знайшов репозиторій з прикладами та інструкціями для використання OpenAI API та колекцією підказок для ChatGPT, які і допомогли мені сформувати новий запит. Ідея полягала в тому, щоб передавати текстовий опис репозиторія замість посилання на нього, а також просити ChatGPT генерувати емодзі, який відповідатиме змісту тексту. Як на мене, влучний емодзі завжди прикрашає текст🤔

Отже, алгоритм такий: бот відкриває посилання на репозиторій та зчитує текст опису. Після цього він видаляє приклади коду та перевіряє довжину тексту. Якщо текст занадто короткий (менше 300 символів), бот переходить до наступного репозиторію, оскільки з 300 символів складно згенерувати адекватний опис. А якщо текст занадто великий (більше 10 000 символів), то він обмежується до цієї довжини, з надією, що вирізання лишнього тексту не завадить згенерувати адекватний опис. Такий ліміт було встановлено через неможливість ChatGPT обробити настільки великий текст. І нарешті, отриманий текст даємо ChatGPT і просимо згенерувати короткий (не більше 600 символів) опис.

Проблему вирішено? Тексти стали кращими, почали відповідати опису репозиторія, отже, можемо вважати, що так.

Займенники

Суть проблеми полягала у тому, що ChatGPT час від часу генерував текст від імені автора каналу або власника репозиторію, що виглядало досить кумедно, але я вирішив це виправити, додавши відповідне прохання в запит:

Ти не повинен використовувати займенники 'я', 'ми', 'наш' у своєму тексті

Здається, проблему вирішено. За останній тиждень я не помітив жодних займенників у тексті, тож можна зробити висновок, що все працює належним чином.

Поганий переклад українською

Спочатку я писав запити до ChatGPT українською, але якість створених текстів мене не задовольняла. Тому я вирішив писати англійською та перекладати результати за допомогою того ж ChatGPT на українську. Стало краще, але іноді штучний інтелект перекладав власні назви, назву проєкту, чи технічні терміни, що виглядало доволі комічно:

Вона доступна як розширення VS Code, а всі коди та ваги моделі доступні публічно для дослідницьких цілей

Я також розглядав можливість додати до бота сервіс перекладу, наприклад, DeepL, який має досить високу якість перекладу. Але він, як я зрозумів, недоступний в Україні. Іншим варіантом був Google, але він платний. Ще я знайшов один безкоштовний сервіс, але якість перекладу там була приблизно як у ChatGPT.

Наразі я припинив пошуки якісного та безкоштовного сервісу для перекладу, проте у майбутньому збираюся повернутися до цього питання. В результаті алгоритм має такий вигляд: пишемо запит до ChatGPT англійською і отриманий результат просимо перекласти українською.

Чи було вирішено цю проблему? Нажаль ні, іноді переклади досить погані, але маю надію, що в подальшому зможу покращити ситуацію, підключивши якийсь сервіс для перекладу, або з розвитком ChatGPT якість перекладу покращиться.

Технічні проблеми

Тут я об'єднаю 4 і 5 пункти. Ідея для випадків, коли сервіси, звідки бот бере дані недоступні, така:

Бот кожного дня в 09:00 і в 16:00 намагається знайти репозиторій в GitHub і потім за допомогою ChatGPT згенерувати текст та зберегти йогу в базу даних.
Якщо один з сервісів недоступний, бот буде намагатись з'єднатися з сервісом кожну хвилину протягом 5 хвилин.
Якщо нічого не вдасться, тоді бот зачекає трохи, і починаючи з 9:30 або для вечірнього посту з 16:30, кожні 10 хвилин буде шукати репозиторій і намагатися згенерувати текст, і так до 50 хвилин.
Якщо все вдалося, то в 10:00 і в 17:00 в канал буде опубліковано повідомлення.

Мені здається, що цього достатньо при короткочасних проблемах у роботі сервісів. Була ідея генерувати повідомлення заздалегідь, наприклад, раз на тиждень або за декілька днів до публікації, щоб мати заготовлені пости. Також була ідея мати резервні джерела, наприклад якщо GitHub не доступний, я міг би брати інформацію з сервісу OSS Insight який я згадував у першій статті. У ChatGPT альтернатив немає, хіба що Bing в якого немає офіційного API але є цікавий проєкт за допомогою якого все ж можна робити запити, але доступність Bing ймовірно залежить від серверів OpenAI. Також є Bard від Google, який наразі недоступний в Україні. Проте на даний момент алгоритм залишається таким, як я описав вище.

Проблему вирішено? Думаю, частково . Якщо сервіси, за допомогою яких бот генерує пости будуть недоступними, наприклад, протягом доби, то звісно, нічого не буде працювати, але для короткочасних перебоїв це спрацює.

Фінальний алгоритм (спрощено)

В назначений час бот починає дуже старанно шукати трендовий репозиторій.
Зчитує та форматує текст опису знайденого репозиторія.
Отриманий текст дає ChatGPT і просить згенерувати короткий опис та один емодзі релевантний тексту.
Просить перекласти текст українською.
Записує результат в базу даних.
В назначений час бот заглядає в базу даних, формує і відправляє повідомлення в групу Telegram.

Підсумки

Загалом результатом я задоволений, початкова задача виконана, канал в Telegram, якого мені не вистачало тепер існує, і контент для нього генерує "хтось інший", а я в цей час займаюся тим, чим мені подобається, пишу код. Частину проблем, з якими я стикнувся на початку вирішено, а ті, що залишилися, планую вирішити пізніше. Крім того, канал вже підкинув мені кілька цікавих репозиторіїв.

У мене немає конкретних планів щодо розвитку каналу. Можливо, я буду намагатися його рекламувати як канал, що "веде штучний інтелект", або залишу як є. Але я точно буду і надалі намагатися вдосконалювати алгоритми генерації текстів і пошуку нових репозиторіїв.

У статті я майже не надавав конкретних прикладів запитів до ChatGPT, оскільки вони не є унікальними та були запозичені з раніше згаданих репозиторіїв. Наприклад, для узагальнення тексту я використовував цей шаблон, а для перекладу - цей. Формат запиту я запозичив тут. Також в тексті немає прикладів коду, адже стаття мала на меті розповісти про цікаве застосування ChatGPT.

Open Ai Telegram Github Chatgpt

Статті про вітчизняний бізнес та цікавих людей:

Lullaby@lullaby.ua
Mantle: розбір шведського бренду активного догляду за обличчям і як зорієнтуватися в лінійці
Mantle вирізняється підходом, рідкісним для догляду за обличчям: замість звичного «anti-age» він говорить про здоров'я шкіри – її бар'єр, рівний тон і сяйво.
Дата публікації: 3 дн. томуЧас на прочитання: 5 хв читати
Теми цього довгочиту:
Mantle
UCloud@ucloud_ua
Хмарні сервіси та їх використання | UCloud
Хмарні сервіси: збереження даних, трансляції, бізнес-програми та освіта. Дізнайтесь, де застосовують хмарні сервіси та як обрати їх для бізнесу.
Дата публікації: 9 липняЧас на прочитання: 4 хв читати
Теми цього довгочиту:
Хмарні Сервіси
Design Print UA@designprintua
Як паковання впливає на сприйняття бренду
Паковання давно перестало бути лише способом перенести або захистити товар. Для бізнесу це частина першого контакту з клієнтом: ще до того, як людина оцінить сам продукт, вона вже бачить матеріал, форму, якість друку та загальну подачу.
Дата публікації: 7 липняЧас на прочитання: 3 хв читати
Теми цього довгочиту:
Виготовлення Упаковки
Л
Леруа@leroymerlin.ua
Розкладний садовий стілець: огляд варіантів від «ЛЕРУА МЕРЛЕН» для дачі та тераси
Мобільні розкладні стільці — елемент комфортного відпочинку на відкритій дачній ділянці, терасі, патіо, в альтанці тощо. На відміну від стаціонарних крісел і диванів, це меблі, які легко переносити з місця на місце, ховати в приміщенні від дощу і брати з собою на заміські пікніки
Дата публікації: 3 липняЧас на прочитання: 4 хв читати
Теми цього довгочиту:
Садові Меблі
Kreisel UA@kreisel
Завод у Фастові: як КРАЙЗЕЛЬ будує українське виробництво світової якості?
Завод німецької компанії КРАЙЗЕЛЬ у Фастові функціонує за суворими німецькими стандартами, випускаючи продукцію з високими експлуатаційними характеристиками і стабільною європейською якістю
Дата публікації: 1 липняЧас на прочитання: 3 хв читати
Теми цього довгочиту:
Будматеріали

Поділись своїми ідеями в новій публікації.
Ми чекаємо саме на твій довгочит!

Написати

Олександр@sigmanor

3Довгочити

641Перегляди

19Підписники

На Друкарні з 14 квітня 2023

Більше від автора

Як штучний інтелект веде Telegram канал (та не лише його) — і у нього це чудово виходить
Десь у далекому 2023 році мені захотілось знайти Telegram канал з постами про цікаві GitHub репозиторії, бо я розробник, й іноді хочеться знайти цікаві інструменти або надихнутись якимось проєктом з відкритим кодом.
Дата публікації: 27 травняЧас на прочитання: 8 хв читати
Теми цього довгочиту:
Chatgpt
Як ChatGPT веде за мене канал в Telegram і у нього це (майже) виходить — Частина 1
Історія про те як я прилаштував ChatGPT для того, щоб він генерував контент для телеграм каналу.
Дата публікації: 14 квітняЧас на прочитання: 7 хв читати
Теми цього довгочиту:
Telegram

Це також може зацікавити:

Олег Піддубний@OlegUkrOd
Історія про то як з’явився TG канал “Україномовний Одесит”.
Україномовний⚓️Одесит - історія адміна TG каналу, який все життя говорив російською в Одесі та перейшов на українську мову.
Дата публікації: 21 червняЧас на прочитання: 4 хв читати
Теми цього довгочиту:
Telegram
Криптобатько@Cryptobatko
🧛Що таке MemeFi? Хайпова гра-клікер у Telegram. Notcoin на максималках.
MemeFi - це унікальна веб-гра, заснована на технології блокчейна, яка поєднує в собі елементи культури мемів і захопливий ігровий процес, зосереджений на взаємодії різних кланів мемів. У цій грі гравці вступають у сутичку за панування і ресурси у величезному світі.
Дата публікації: 10 квітняЧас на прочитання: 5 хв читати
Теми цього довгочиту:
Криптовалюта
КриптоПанда@cryptoPanda
Безпека використання Telegram в Україні: Що варто знати
Telegram популярний месенджер, який використовується мільйонами людей по всьому світу. Проте питання безпеки й конфіденційності стає дедалі важливішим, особливо у контексті різних країн, включаючи Україну.
Дата публікації: 26 червняЧас на прочитання: 3 хв читати
Теми цього довгочиту:
Telegram

Як штучний інтелект веде Telegram канал (та не лише його) — і у нього це чудово виходить

Теми цього довгочиту:

Як ChatGPT веде за мене канал в Telegram і у нього це (майже) виходить — Частина 1

Теми цього довгочиту:

Передмова

Воно живе (на перший погляд)

Систематизація проблем

Красива, але безглузда маячня

Займенники

Поганий переклад українською

Технічні проблеми

Фінальний алгоритм (спрощено)

Підсумки

Статті про вітчизняний бізнес та цікавих людей:

Mantle: розбір шведського бренду активного догляду за обличчям і як зорієнтуватися в лінійці

Теми цього довгочиту:

Хмарні сервіси та їх використання | UCloud

Теми цього довгочиту:

Як паковання впливає на сприйняття бренду

Теми цього довгочиту:

Розкладний садовий стілець: огляд варіантів від «ЛЕРУА МЕРЛЕН» для дачі та тераси

Теми цього довгочиту:

Завод у Фастові: як КРАЙЗЕЛЬ будує українське виробництво світової якості?

Теми цього довгочиту:

Більше від автора

Як штучний інтелект веде Telegram канал (та не лише його) — і у нього це чудово виходить

Теми цього довгочиту:

Як ChatGPT веде за мене канал в Telegram і у нього це (майже) виходить — Частина 1

Теми цього довгочиту:

Це також може зацікавити:

Історія про то як з’явився TG канал “Україномовний Одесит”.

Теми цього довгочиту:

🧛Що таке MemeFi? Хайпова гра-клікер у Telegram. Notcoin на максималках.

Теми цього довгочиту:

Безпека використання Telegram в Україні: Що варто знати

Теми цього довгочиту:

Коментарі (2)

Це також може зацікавити:

Історія про то як з’явився TG канал “Україномовний Одесит”.

Теми цього довгочиту:

🧛Що таке MemeFi? Хайпова гра-клікер у Telegram. Notcoin на максималках.

Теми цього довгочиту:

Безпека використання Telegram в Україні: Що варто знати

Теми цього довгочиту: