10 ноября 2023

OpenAI запускает программу по сбору уникальных данных от организаций

НАСТОЯЩИЙ МАТЕРИАЛ (ИНФОРМАЦИЯ) ПРОИЗВЕДЕН И (ИЛИ) РАСПРОСТРАНЕН ИНОСТРАННЫМ АГЕНТОМ «РОСКОМСВОБОДА» ЛИБО КАСАЕТСЯ ДЕЯТЕЛЬНОСТИ ИНОСТРАННОГО АГЕНТА «РОСКОМСВОБОДА». 18+
Эти датасеты будут использоваться для обучения моделей искусственного интеллекта (ИИ) компании.

Компания OpenAI объявила о запуске партнёрской программы OpenAI Data Partnerships, целью которой является получение уникальных наборов данных от сторонних организаций для обучения своих ИИ-моделей. Эта инициатива направлена на привлечение обширных баз данных, в том числе тех, которых нет в свободном доступе. Отличительной чертой программы является её всеобъемлющий характер: данные не обязательно должны быть количественными или в текстовом формате — программа также открыта для изображений, аудио и видео.

OpenAI подчёркивает, что ищет данные по любой теме и на любом языке, если они «выражают человеческие намерения». Ожидается, что информация, ориентированная на человека, поможет компании улучшить такие инструменты, как технология автоматического распознавания речи для расшифровки произнесённых слов. Кроме того, она позволит улучшить модель GPT-4 Turbo, которая будет предоставлять пользователям более сложные и содержательные ответы.

OpenAI заявляет, что уже начала работать с заинтересованными организациями, включая правительство Исландии. Так, компания уже обучает модели лучше понимать запросы на исландском языке.

Чтобы принять участие в программе, нужно отправить форму на веб-сайте компании и поделиться информацией о типе и размере данных. Это может быть архив с открытым исходным кодом, но материалы в нём станут общедоступными. В качестве альтернативы OpenAI предлагает отправлять информацию через свой собственный канал, который будет ориентирован на обучение «точно настроенных пользовательских моделей». Однако компания подчёркивает, что ей не требуются наборы данных, содержащие конфиденциальную или личную информацию.

На днях OpenAI представила более мощную и дешевую версию своей языковой модели — ChatGPT-4 Turbo. Она уже доступна через API, предел ее знаний — апрель 2023 года. В компании заявили, что новая версия обходится разработчикам в три раза дешевле — 0,01$ за 1000 входных токенов и 0,03$ за 1000 выходных токенов.

Контакты

По общим вопросам

[email protected]

По юридическим вопросам

[email protected]

Для СМИ

Телеграм: moi_fee
Signal: moi_fee.13

18+

23 декабря 2022 года Минюст включил Роскомсвободу в реестр незарегистрированных общественных объединений, выполняющих функции иностранного агента. Мы не согласны с этим решением и обжалуем его в суде.