
OpenAI вперше з 2019 року випустила повноцінні моделі з відкритими вагами, тобто такі, з якими розробники можуть не просто бачити результат, а й безпосередньо працювати з внутрішніми числовими параметрами моделі. Їх можна завантажити, запускати локально, модифікувати та інтегрувати у власні системи.
Моделі називаються gpt-oss-20b і gpt-oss-120b, і містять відповідно 20 і 120 мільярдів параметрів. Вони викладені у відкритий доступ на GitHub, де можна знайти і ваги моделей, і код для їхнього запуску.
Вони працюють навіть на Apple Silicon, тобто для їхнього використання не потрібен сервер чи інтернет, усе можна обчислювати локально, без зовнішнього контролю чи затримок, пов'язаних із хмарною обробкою.
Це важливо, адже більшість сучасних моделей, включно із самим ChatGPT, працюють винятково через API і жорстко контролюються їхніми розробниками.
OpenAI поширює ці моделі під ліцензією Apache 2.0, однією з найбільш вільних у світі програмного забезпечення. Це означає, що їх можна використовувати як у дослідницьких, так і в комерційних цілях без будь-яких обмежень, включно з перепакуванням або інтеграцією у власні продукти.
При цьому компанія супроводжує реліз політикою сумлінного використання, мовляв, інструменти повинні служити безпечному, відповідальному і демократичному застосуванню.
З технічного погляду моделі мають конкурентоспроможний вигляд: версія на 120 мільярдів параметрів - це модель типу Mixture-of-Experts, яка задіє не всі параметри одночасно, а тільки частину, завдяки чому видає результати швидше і потребує менше ресурсів.
В обох моделей контекстне вікно 128 тисяч токенів, що дає змогу працювати з довгими текстами і складнішою логікою.
Раніше глава OpenAI попередив, що ваші листування з ChatGPT можуть бути використані в суді. Чинне законодавство не надає АІ-чатботам особливого статусу конфіденційності.