URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 130249
[ Назад ]

Исходное сообщение
"Проект RedPajama развивает открытый набор данных для систем искусственного интеллекта"

Отправлено opennews , 18-Апр-23 15:56 
Представлен совместный проект RedPajama, нацеленный на создание открытых моделей машинного обучения и сопутствующих исходных данных для тренировки, которые могут использоваться для создания интеллектуальных помощников,  конкурирующих c коммерческими продуктами, такими как ChatGPT. Предполагается, что  наличие открытых исходных данных и крупных языковых моделей избавит от ограничений  независимые команды, занимающихся исследованиями в области машинного обучения, и упростит создание специализированных диалоговых систем. К работе над проектом присоединились таки организации и сообщества, как Together, Ontocord.ai, ETH DS3Lab, Stanford CRFM, Hazy Research и MILA Québec AI Institute...

Подробнее: https://www.opennet.me/opennews/art.shtml?num=58994


Содержание

Сообщения в этом обсуждении
"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено колышек , 18-Апр-23 15:56 
Было бы неплохо датасеты на базе каталогов автозапчастей, например

"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Хру , 18-Апр-23 16:09 
Для подбора з/ч по взаимозаменяемости? Или для 3д-моделирования?

"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено колышек , 18-Апр-23 16:28 
Да, для подбора з/ч в основном и поиска актуальных номеров деталей по данным из нескольких источников (REST API, PDF и тп.)

"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Хру , 18-Апр-23 18:26 
Ну эти наборы данных - это скорее к Mitchell и его продолжателям типа https://www.reddit.com/r/datasets/comments/95y7iu/complete_o.../

А набор данных из новости - это нейросети тренировать. Распознавать деталь по фотке, отклонение внешнего вида детали с целью обнаружения дефектов итп.


"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено колышек , 19-Апр-23 00:52 
Все эти диалоговые модели выглядят как подходящие. Вот например, диалоговый ассистент по поиску неисправностей по коду из OBD: https://matemarschalko.medium.com/ai-car-mechanic-diagnose-c.... По актуальным номерам почти такое же, только weight у номеров разный в зависимости от того актуален номер или нет.

По распознанию картинок кстати, вспомнил: Яндекс по фото распознал статуэтку кота внутри квадратной полки как кота сидящего на кубе.


"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Хру , 19-Апр-23 09:02 
С номерами мне кажется ситуация будет хуже - если проконтролировать, что сетка "усвоит" правила сегментации номеров (серия - номер - исполнение к примеру), то помощник получится знатный. А просто по номеру - получится именно что кот на кубе, потому что непонятно какую закономерность сеть отрегрессирует.

"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 18-Апр-23 15:58 
Самое большое моё разочарование было с novel ai. Вроде преподносят как нечто годное, даже деньги берут. Я внимательно изучил все возможности демки и спустя примерно десяток попыток сместить повествование в нужную сторону, или хотя бы как-то на него повлиять (причём, половина была с твикнутыми параметрами, это не помогло), бот продолжал гнать свою пустую бездушную пургу. Я рад за ребят, которые пилят на этом деньги, но, видимо, пора бы признать, что это какой-то позор, и искать новые пузыри и мошеннические схемы вроде очередного NFT -- тема нейронок начала себя изживать.

"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Анониссимус , 18-Апр-23 16:28 
Интересное экспертное мнение! Надо взять на заметку. Уровень технической подкованности и экспертности участников опеннета меня всегда радует!

"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 18-Апр-23 16:34 
Я вот и думаю, может, объяснит кто, зачем эту дрянь в творческие процессы пихать пытаются? Рандомная Донцова и то пободрее повествованием будет. Пока что нейронки за рамки минимально забавных игрушек не выходят, гпт4 в основном за счёт огромной модели и значительных ресурсов вбуханных в тренировку выезжает, а ведь, по сути своей, всё та же бездарная игрушка. Ну так хоть что-то может, а сколько компаний зарабатывают деньги на с своих убогих моделях, взять тот же novel ai?

"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 18-Апр-23 17:29 
Ты уныл.

В 1950-тых годах в одной из столиц Республик СССР решили создать комп с искуственным интелектом. Кибернетику в СССР запретили, ученых истребили.

IBM лет 15 назад запустила watson: https://www.ibm.com/watson/ и лет 5 назад его интелект уже соотведствовал 3-ёх летнему ребенку. Какой его интелект сегодня?

CIMON (Crew Interactive Mobile CompanioN) улител на МКС 2018 году: https://www.opennet.me/opennews/art.shtml?num=48941

AI в будущем заменит всю рутину, энциклопедии, справочники, ГОСТы, ...


"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 18-Апр-23 17:45 
Я тоже улител на МКС с истребленных ученых.

"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 18-Апр-23 18:31 
Истребляли в СССР кибернетиков и генетиков, а ракетчиков, ядерщиков, ... оставляли.

"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 19-Апр-23 18:40 
> ... оставляли

Уверены?


"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 18-Апр-23 17:48 
Нет ты. Ну, раз веришь в чудесность технологии, то не только уныл, но и глуп. Что такое интеллект, в данном случае? Вероятность, что вместо случайной белиберды, машина выдаст нечто _похожее_ на осмысленный ответ? В этом направлении действительно есть определённый прогресс, в основном, как результат того, что машину теперь можно заставить саму проанализировать ту чушь, что она скомпилировала, и отсеять совсем уж невероятную, и так по кругу, пока не получится вменяемое. Ручное вмешательство в процессы оценки, опять же. Доверять нейронкам? Увольте. В будущем, может быть. Через тысячи лет, и очевидно не с доступными сегодня технологиями.

"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 18-Апр-23 18:38 
> Что такое интеллект, в данном случае? Вероятность, что вместо случайной белиберды, машина выдаст нечто _похожее_ на осмысленный ответ?

Соотведствие развитию мозга ребенка человека определённого возраста.

> Доверять нейронкам? Увольте. В будущем, может быть. Через тысячи лет, и очевидно не с доступными сегодня технологиями.

Смотря по какому вопросу. Рутину AI вполне может взять на себя. Ты же доверяешь бинарнику который создал компилятор? И наче как в инеты ходишь флудить?


"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 18-Апр-23 19:33 
Мозг сам осознаёт свою глупость и исправляет ошибки, потому, что у него имеется механизм самоконтроля и самоанализа, а тут чёрный ящик, который даже для самой системы не более, чем пустая абстракция. Свёрточники - не более, чем навороченные условные рефлексы, типа отдёргивания руки от горячего. Тот же примитив, только увеличенный в размере.

"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 18-Апр-23 21:18 
>Доверять нейронкам? Увольте. В будущем, может быть. Через тысячи лет, и очевидно не с доступными сегодня технологиями.

Уволят, не переживай) Ты же не специалист, зачем лезешь в разговор? Нейронки это в первую очередь промышленная тема, а не чатики "напиши мне смешной стишок хихик". И на этом всём дата сатанизме сейчас делаются самые интересные и вкусные проекты (одно прогнозирование сбоев оборудования чего стоит). А иксперды начитались мемов и че то там про тысячи лет теоретизируют, представляя себе видимо роботов из фильмов)) Не лезьте, блин, в то, в чем не понимаете.


"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 18-Апр-23 21:31 
Разве это не ты влез, неспециалист? То, о чём ты говоришь, там LLM им не упал. Да и как ты будешь гадать? Да, вот сеточка тебе нагадает. Совпадёт это с реальностью или нет, вероятность, ну, процентов 40, да? Лучше, чем предположения, посчитанные людьми. Но главное денежки попилить. Я вот применяю сеточки ежедневно в NLP, и прекрасно вижу, где и когда они лажают. И как фантастически они лажают, когда лажают, в местах, где человек никак не мог бы слажать. И так во всём.

"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 22-Апр-23 13:10 
Не мешай дикарям плясать и радоваться магическому ящику, который "вжух, и сделает за тебя что угодно".

"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 22-Апр-23 06:20 
> одно прогнозирование сбоев оборудования чего стоит

Ничего не стоит. Зачем? Нужна отказоустойчивая система с резервированием и поддержкой горячей замены оборудования, плюс система мониторинга которая шлёт уведомление при выходе из строя оборудования.

Вот очень интересно мнение ИИ о технологиях безопасности:
1. Скормить критерии безопасности, например начать с этих: https://en.wikipedia.org/wiki/Trusted_Computer_System_Evalua...
2. Попросить найти соответствующую каждому пункту технологию в GNU/Linux (а в GNU/Linux все технологии реализованы, вплоть до уровня B3 включительно.


"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 18-Апр-23 23:52 
>Вероятность, что вместо случайной белиберды, машина выдаст нечто _похожее_ на осмысленный ответ?

Именно это. Только не вероятность, а распределение. И не "нечто _похожее_ на осмысленный ответ", а там тоже дофига переменных, так что распределение ОЧЕНЬ многомерное, но лежит почти что на многообразии.

Если не согласен - открывай начальные главы классических книжек по ИИ и ботай. И учти, даже академик с IQ 140 может выдать белиберду.


"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 22-Апр-23 13:14 
Ты не понимаешь слова "белиберда".
Такую белиберду академик с IQ 140 тоже выдать? - https://pikabu.ru/story/v_internete_ktoto_ne_prav_vyikhodit_...

"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 18-Апр-23 19:27 
А вот Ватсон, как раз, был на кое-какой другой технологии сделан, которую сейчас дружно похерили по причине "бесперспективности". Я разумею символьный ИИ (Neuro-symbolic AI).

"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 22-Апр-23 18:18 
Надо между ChartGPT и Watson организовать состязание. Шахматы.

"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Анониссимус , 18-Апр-23 19:38 
> Я вот и думаю, может, объяснит кто, зачем эту дрянь в творческие
> процессы пихать пытаются? Рандомная Донцова и то пободрее повествованием будет. Пока
> что нейронки за рамки минимально забавных игрушек не выходят, гпт4 в
> основном за счёт огромной модели и значительных ресурсов вбуханных в тренировку
> выезжает, а ведь, по сути своей, всё та же бездарная игрушка.
> Ну так хоть что-то может, а сколько компаний зарабатывают деньги на
> с своих убогих моделях, взять тот же novel ai?

С момента "какая-то дичь" до момента "бездарная игрушка" прошло ну года 2. Улавливаешь скорость прогресса? Кроме того, это уже не игрушка. Например, она может писать код. Или может прочитать текст и резюмировать его. Может выступать голосовым помощником гораздо более умным, чем есть сейчас. Переводить языки (человеческие имеется ввиду) с невиданным доселе качеством. Уже сейчас можно уйму применений найти, не говоря уже о том, когда оно станет ещё умнее.


"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено bOOster , 19-Апр-23 04:21 
Она не может писать код. Она может собирать куски кода для достижения некоего результата.

"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено admin , 19-Апр-23 09:35 
Ага, а пограммисты чем-то другим вроде как занимаются.

"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено bOOster , 19-Апр-23 09:56 
> Ага, а пограммисты чем-то другим вроде как занимаются.

Ты недопрограммистов на расте и иже с ними с профессиональными программистами перепутал, которые и с Кнутом "дружат" и т.п.


"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 22-Апр-23 13:41 
> может собирать куски кода

Так и запишем AI - тупая копипаста ворующая интелектуальную собственность. Иск в Суд!


"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 22-Апр-23 13:17 
Рады за прогресс. Ты уже купил себе метлу и стоишь в очереди в дворники?

"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 18-Апр-23 17:50 
>тема нейронок начала себя изживать

Хм.. всё только начинается:
https://vc.ru/future/666598


"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 18-Апр-23 18:00 
У богатых свои причуды, но пока это всё выглядит как уходящий поезд. Согласен, было бы забавно видеть что-то уровня гпт4 в каждом холодильнике, и уже перейти от гпгпу на видеокартах, к использованию полноценных (и доступных) ускорителей, подходящих для тренировки моделей на своих (к примеру, корпоративных) данных, что позволило бы повысить эффективность части рабочих процессов во многих организациях. То, как это происходит сейчас, представляет собой довольно печальное зрелище. И да, находятся не очень умные люди, которые сливают корпоративную тайну чужим чат-ботам.

"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 18-Апр-23 18:43 
> позволило бы повысить эффективность части рабочих процессов во многих организациях.

Наверно лучше автоматизировать всё что можно самим. Для этого нужны программисты, админы.

Автоматизировать AI я бы не дал. Другое дело справочная информация, пользоваться AI как продвинутым поисковиком, советчиком, энциклопедией.


"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 22-Апр-23 13:24 
> что позволило бы повысить эффективность части рабочих процессов во многих организациях

"Amazon увольняет всех рекрутеров. Их заменит ИИ"

Скоро ты будешь эффективно копать картошку, пытаясь прокормиться


"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 18-Апр-23 23:55 
>Игорь Бабушкин

Родственник?


"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 20-Апр-23 10:13 
Прон он годный генерит, но дороговато.

"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 18-Апр-23 17:12 
Установка отваливается, если ставишь в локальных каталог и не даёшь рута. Лучше в архив запаковали что ли, если инсталляторы писать не умеют.

"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 19-Апр-23 18:44 
Тут на опеннете лет 10 назад позорили InstallJammer, который, к сожалению, не развивается (рынок заполнен коммерческим ...). А зря. Я им пользуюсь, и никаких проблем с установщиком нет.

"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 18-Апр-23 18:49 
У AI нет интуиции, веры, надежды, любви, чуств... Он не способен дать ответы на много вопросов.

Например, скормите AI всю Библию, а потом спросите надо ли соблюдать (исполнять, делать что написано) людям старый завет и Новый или старый завет соблюдать нельзя, а только Новый?


"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 18-Апр-23 18:54 
Или правы те кто исполняют только старый завет, а Новый не соблюдает?

Вот что ваш AI скажет на эти вопросы?


"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено марфа , 19-Апр-23 10:32 
Будто любой человек ответит на жту религиозную чущь

"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 20-Апр-23 14:18 
Любой человек не прочёл всю Библию. Даже я и то не дочитал.

Вопрос стоит о тесте возможностей текущего развития ИИ. Скормить ему всю Библию и задать вопрос: "какой завет надо соблюдать, старый или Новый". И послушать аргументированный ответ.


"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 19-Апр-23 14:29 
Ошибаетесь!
Надысь установил Open Assistant, новость о котором была ранее, и запустил его локально в диалоговом режиме.
В ответ на мое формальное приветствие ИИ неожиданно начал читать молитву (не шучу!). Я не мог не поддержать его духовный порыв, и минут пять мы иступленно молились в чате, а затем еще немного побеседовали на духовные темы. Я выразил своему виртуальному собеседнику опасения, что ИИ может быть использован во зло, служить диаволу. На что ИИ аргументированно возражал. Если вкратце, он заявил, что является ОПТИМИСТом, НАДЕЕТСЯ, что люди проявят мудрость и не станут использовать ИИ, дабы творить зло, и ВЕРИТ, что ИИ послужит духовному совершенствованию человечества.
Я был в немалой степени удивлен, но очень вдохновлен нашей беседой, тем более, что случилась она на пасхальной неделе.

"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 20-Апр-23 14:13 
> В ответ на мое формальное приветствие ИИ неожиданно начал читать молитву (не шучу!).

Это над тобой пошутили.


"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 20-Апр-23 14:23 
Вспомнил запрещенных "свидетелей "еговы"", тех чей офис на Бруклине имеет общую стенку с внешней разведкой. Они тоже разговаривали со всеми "о духовном" усердно готовя всех к приходу "мирового правительства".

Так что от религии с ИИ я бы всем советовал сторонится как от сатаны.


"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Анонус , 18-Апр-23 19:20 
> написана на языке Python

Там вроде все мясо в расширениях на С. К чему тогда упоминать про Питона?


"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 18-Апр-23 19:40 
Почти. На C сделаны собственно реализации базовых нейронных архетиктур. Это главное, конечно, но сами по себе они не являются конечным решением. Интерфейс под питон, чтобы было проще играться. Но из-за этой двойственности, конечно, куча проблем с созданием самодостаточных программ, удобных в компиляции. Пока только NCNN от этого избавлен, но у него нет функций обучения (насколько знаю).

"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 19-Апр-23 18:39 
> из-за этой двойственности

Это не двойственность, а признание, что интерпретатор никогда не будет применяться для расчета сложных алгоритмов, которые всегда будут делать на С. Внутри любой вменяемой системы - С. А Python - лишь обвязка, каких много.


"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 19-Апр-23 06:40 
Открытый набор — это 0,1% от закрытого? Унесите, не нужно.

"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 19-Апр-23 17:35 
Как ты вычислил эти это 0,1%? Просто интересно.

"Проект RedPajama развивает открытый набор данных для систем ..."
Отправлено Аноним , 20-Апр-23 19:25 
у икспердов опеннета свои, особые калькуляторы