Skip to content

Хакери дуже прагнуть покращити ШІ

24 de Травень de 2022

Ключові речі на винос

  • Новий колектив розробників створює моделі AI з відкритим кодом.
  • Група використовує масові моделі мовного навчання, які вона випустить за відкритими ліцензіями.
  • ШІ з відкритим вихідним кодом може допомогти зробити потужність нової технології, яка може змінити гру, менш схильною до упереджень і помилок.
Великі компанії проводять багато досліджень штучного інтелекту, але одна онлайн-група хоче демократизувати цей процес. EleutherAI — нещодавно сформований колектив дослідників, інженерів та розробників-добровольців, які зосереджені на дослідженнях ШІ з відкритим кодом. Організація використовує кодові бази GPT-Neo і GPT-NeoX для навчання масивних мовних моделей, які планує випустити під відкритими ліцензіями. «Дані з відкритим вихідним кодом приносять користь дослідникам, оскільки вчені мають більше безкоштовних ресурсів для навчання моделей і завершення досліджень», — сказав Едвард Куї, генеральний директор компанії зі штучним інтелектом Graviti, в інтерв’ю Lifewire. Його компанія не причетна до EueutherAI. «Ми знаємо, що десятки проектів штучного інтелекту були затримані через загальну відсутність високоякісних даних із реальних випадків використання, тому дуже важливо створити рекомендації, які забезпечують якість даних, за допомогою спільноти, яка бере участь».

Це шлях

Початки EleutherAI були скромними. Минулого року незалежний дослідник ШІ ім Коннор Ліхі опублікував таке повідомлення на сервері Discord: «Привіт, хлопці, дозвольте [SIC] дайте OpenAI заробити на свої гроші, як у старі добрі часи.” І так, група була сформована. Тепер у неї є сотні учасників, які розміщують свій код в онлайн-сховищі програмного забезпечення GitHub. Зусилля з відкритим джерелом штучного інтелекту не є новим. Фактично, платформа керування робочим процесом Airbnb Airflow і механізм пошуку даних Lyft є результатом використання інструментів з відкритим вихідним кодом, щоб дати можливість командам даних краще працювати з даними, зазначив Алі Реман, менеджер проектів компанії CloudiTwins, що розробляє програмне забезпечення, в електронному інтерв’ю Lifewire. «Так само, як революція відкритого коду призвела до трансформації розробки програмного забезпечення, вона також стимулює розвиток та демократизацію науки про дані та штучного інтелекту, — сказав Реман. — Відкритий код став найважливішим фактором для корпоративних даних. наукові рішення, причому більшість дослідників даних використовують інструменти з відкритим кодом».

Відкриття дверей

Деякі оглядачі стверджують, що розвиток штучного інтелекту з відкритим вихідним кодом може допомогти зробити потенціал нової технології, що може змінити гру, менш схильним до упереджень і помилок. Дослідження штучного інтелекту зараз в основному проводяться відкрито, і майже всі компанії, дослідницькі лабораторії та університети відразу представляють свої результати в наукових публікаціях, сказав Куш Варшні, дослідник AI з IBM, в інтерв’ю Lifewire. «Ця відкрита спільнота є важливою, оскільки вона забезпечує підвищені рівні стримувань і противаг, щоб гарантувати, що ШІ досліджується, створюється, розгортається та застосовується відповідально», — додав Варшні. «Це особливо важливо в ситуаціях, коли ці системи можуть впливати на життя наших найуразливіших членів суспільства. Ця відкритість стосується не лише загального машинного навчання та алгоритмів глибокого навчання, а й елементів надійного ШІ». Реман сказав, що однією з важливих відмінностей між запатентованим програмним забезпеченням і програмним забезпеченням з відкритим кодом є гнучкість і налаштування. Запатентовані дослідження AI будуть мати проблеми з безпекою, оновленнями та оптимізацією.

Хтось вводить код на портативному комп’ютері.

«Це тому, що підхід спільноти з відкритим кодом отримує цінний внесок від тисяч експертів галузі, які визначають потенційні вразливості безпеки, які потім усуваються швидше», — додав Реман. «Консенсус громади означає, що якість гарантована, а нові можливості легше визначити». Інша проблема полягає в тому, що власні дослідження штучного інтелекту не будуть сумісними, а це означає, що вони не можуть працювати з різними форматами даних і, ймовірно, будуть мати фіксацію постачальника, що не дозволяє компаніям тестувати та випробовувати програмне забезпечення, перш ніж прийняти рішення, сказав Реман. Але не кожен аспект досліджень штучного інтелекту має бути відкритим, Кріс Кент, генеральний директор медичної компанії AI Reveal Surgical, сказав Lifewire в електронному інтерв’ю. «Важливо захистити економічні стимули, які стимулюють комерційний розвиток ключових додатків ШІ», — сказав він. Однак дослідження ШІ потребує надійного компонента з відкритим кодом, сказав Кент. Він додав, що відкритий код працює для створення довіри та використання наборів даних, які не контролюються або не повинні контролюватися окремими установами чи компаніями. «Підхід із відкритим кодом — найкращий спосіб визначити та компенсувати основне упередження, яке може існувати в навчальних наборах і призведе до більш цілісного, креативного та надійного застосування ШІ», — сказав Кент.