[0:00]Сегодня я пообщаюсь с Питером Штайнбергером, создателем OpenClaw, персонального ИИ-агента с открытым кодом, который просто взорвал интернет.
[0:08]Репозиторий на GitHub взлетел до 160.000 звёзд практически за одну ночь. Сообщество создало массу проектов, вроде MoltBook, где боты общаются между собой.
[0:19]И теперь боты даже нанимают людей для выполнения задач в реальном мире. В нашей беседе мы обсудим, как его озарило созданием такого ИИ-агента.
[0:29]Его нестандартные принципы разработки и то, что всё это значит для создателей в 26 году.
[0:39]Рад тебя видеть, дружище. Привет, как дела?
[0:43]Похоже, ты сделал то, что нужно людям. Кажется, да. OpenClaw, как он теперь называется, абсолютно. Это уже пятое название, да.
[0:51]Он просто взорвал интернет. Как прошли эти последние пару недель?
[0:57]Боже мой, мне нужна. Нужна пещера, и неделя одиночества.
[1:04]Ты только что вышел из пещеры и уже хочешь обратно, как маленький лобстер.
[1:08]Это безумие. Не знаю, как один человек может это всё переварить. Мне, наверное, нужна ещё неделя, только чтобы ответить на все письма.
[1:17]Были и невероятно крутые вещи, и ужасные. Но, очевидно, я создал то, что вызвало эмоции, заинтересовала и вдохновила людей. Это очень здорово.
[1:29]Многие работали над ИИ и персональными ассистентами. Как думаешь, почему именно OpenClaw так выстрелил?
[1:37]Думаю, главное отличие в том, что он работает прямо на твоём компьютере. Всё, что я видел до этого, работало в облаке.
[1:45]Облачный ИИ умеет делать несколько прикольных штук, но если запустить его локально, он может абсолютно всё, понимаешь, и это куда мощнее.
[1:54]Да, машина может делать всё, что ты сам можешь делать с её помощью. Он может подключиться к духовке, к Тесле.
[2:02]К свету, к Sonos, к моей кровати, он может менять температуру моей постели. ChatGPT на такое не способен.
[2:09]Ты даёшь ему все свои навыки. Друг рассказывал, он установил OpenClaw.
[2:17]И тот предложил изучить файлы в компьютере и составить рассказ о прошедшем годе. Получилась потрясающая история, и он такой: Как ты это сделал?
[2:27]А OpenClaw нашёл аудиозаписи. Друг каждое воскресенье что-то записывал.
[2:34]Он сам об этом забыл, ведь это было больше года назад. Просто имея доступ ко всему компьютеру, ИИ может тебя удивить.
[2:47]Ты ведь отдаёшь ему все данные. Так что он может удивлять тебя по-разному. И вот теперь мы переходим от взаимодействия человека с ботом, о котором ты говорил.
[2:59]К общению ботов между собой, или даже ботов с людьми, когда они от твоего имени нанимают кого-то для задач в реальном мире.
[3:10]Что вообще происходит? Думаю, это естественный следующий шаг. О'кей. Допустим, я хочу забронировать столик.
[3:19]Мой бот свяжется с ботом ресторана и проведёт переговоры, потому что так эффективнее. Или, может, это старый ресторан, и моему боту придётся привлечь человека, чтобы тот позвонил туда, потому что они не любят ботов.
[3:36]Или сходил бы туда постоять в очереди. Если владелец не найдёт для этого робота.
[3:42]И я представляю, что у меня может быть даже несколько ботов. Своего рода специалисты. Один для личной жизни, другой для рабочих дел.
[3:52]Может, один будет отвечать за наши отношения. Не знаю, мы в самом начале пути.
[4:00]Столько всего ещё предстоит понять, выяснить, как это на самом деле. Но я чувствую, что процесс уже запущен.
[4:08]Похоже, все сгнались за неким централизованным сверхразумом. А за последние 10 дней появилась нечто вроде ролевого интеллекта и интеллекта сообщества.
[4:20]Думаю, если посмотреть на одного человека, чего он может достичь сам по себе. Смог бы один человек создать iPhone?
[4:30]Или в одиночку полететь в космос? Один человек, скорее всего, даже еду бы не смог себе найти.
[4:38]Но в группе мы специализируемся. В масштабах общества эта специализация ещё глубже. Чему мы можем поучиться у этого опыта, чтобы применить в ИИ?
[4:50]У нас уже есть ИИ, который специализируется на определённых вещах. Хотя это ИИ общий интеллект. Что, если он одновременно будет и специализированным?
[5:03]Уверен, это будет очень захватывающе. Да, ты словно открыл окно в будущее. И теперь куча людей что-то на этом строит, и у них случается свой момент озарения.
[5:12]Можешь вспомнить, когда у тебя случился этот момент озарения и описать его?
[5:17]Мне хотелось чего-то простого. Вводишь текст, и компьютер выполняет задачу. Совсем просто.
[5:24]В мае или июне я собрал одну версию. Было круто, но не совсем то.
[5:32]Потом я наворотил кучу всего другого. И собрал целую армию.
[5:38]И в ноябре настал день, когда мне снова это понадобилось. Я ушёл на кухню и просто хотел проверить, продолжают ли мой компьютер выполнять задачи. Или закончил ли он их?
[5:50]И задачами было программирование. Да, конечно. Ты кодил что-то другое или саму эту штуку?
[5:57]Нет, нет, просто снова возникла потребность, и я такой: Что ты тогда кодил? Что создавал?
[6:04]Боже, если заглянуть в мой GitHub, там проектов 40. Я уже и не помню. Это была штука под названием Summarize.
[6:14]Небольшое консольное приложение. Даёшь ему что угодно: подкаст или вот такое интервью, и оно делает краткий пересказ с слайдами прямо в терминале. Теперь это возможно.
[6:26]Так что из любви к компьютерам ты начал возиться с разными штуками. Ты ведь фактически вернулся из отставки, чтобы заняться ИИ.
[6:34]И постепенно так втянулся, что захотел делать это постоянно. Даже на ходу с телефоном. Мой последний проект. Я 2 месяца работал над Wipe Tunnel.
[6:46]И дошло до того, что я кодил даже в гостях у друзей. Я понял, надо завязывать. Это вызывает слишком сильное привыкание.
[6:56]А в ноябре потребность вернулась. Я начал делать Claudbot, который теперь называется OpenClaw.
[7:04]С самого начала я понимал, что переделываю всё заново, но на этот раз гораздо лучше. Теперь не нужно печатать в терминале. Ты просто общаешься как с другом.
[7:13]Не думаешь о сжатии, новых сессиях, о том, в какой ты папке или какую модель используешь. Я оставил возможности для продвинутых пользователей.
[7:23]Но обычно ты просто говоришь с другом. Это некая сущность или призрачный помощник, который управляет твоей мышью, клавиатурой и просто делает всё сам.
[7:34]И когда наступил тот момент озарения, когда ты понял: Ого, эта штука умеет гораздо больше, чем я предполагал.
[7:42]Буквально через час после создания первого очень корявого прототипа. Это была просто склейка между WhatsApp и Claudcode.
[7:55]Я вызывал Claudcode и получал от него строку. Работало медленно, но работало. Но мне хотелось картинок, чтобы модель могла присылать изображения или создавать их для меня.
[8:10]На это ушло ещё несколько часов. Потом я поехал в Маракеш на день рождения.
[8:16]Интернет там был так себе, но WhatsApp работает везде. Там же просто текст. Я часто пользовался им в ресторанах.
[8:24]Делал фото и просил перевести. Это было безумно полезно и приятно, потому что он общался на моём языке.
[8:34]С юмором, немного дерзко. И вот я иду и отправляю ему голосовое сообщение.
[8:42]И тут до меня доходит: Стоп, это не сработает, я же этого не настраивал. Индикатор набора текста мигал секунд 10. И вдруг приходит ответ.
[8:50]Я в шоке. Как ты, чёрт возьми, это сделал? И он отвечает: Я сделал вот что.
[8:57]Ты отправил мне сообщение. Я увидел файл без расширения, заглянул в заголовок и понял, что это формат Opus.
[9:04]С помощью FFmpeg сконвертировал его в Wave. Потом хотел расшифровать, но локальный Whisper не был установлен. Тогда он поискал в системе.
[9:11]Нашёл мой ключ OpenAI, и через cURL отправил запрос. Получил текст и ответил мне. И всё это секунд за девять.
[9:18]При том, что ты этого не встраивал и не ожидал. Модели для кодинга стали настолько хороши.
[9:27]Что их навык творческого решения задач отлично переносится в реальный мир. Есть огромная корреляция. Это абстрактный навык.
[9:36]Умение решать проблемы применимо не только к коду, но и к любой жизненной задаче. Модель увидела: О, странный магический файл. Не знаю, что это, надо разобраться.
[9:52]И сделала всё возможное. Она даже сообразила не устанавливать Whisper локально, потому что знала, скачивание модели займёт несколько минут.
[10:04]А я человек нетерпеливый, поэтому она выбрала самый разумный путь. В тот момент я просто офигел.
[10:16]Вот тут я понял, что это вещь. Подпишись прямо сейчас на мой Telegram-канал по ссылке в описании. Я подготовил для тебя топ-3 материала, которые, на мой взгляд, должен знать каждый.
[10:26]Первое. Карта сотни топовых AI-стартапов. Это будущее на одной картинке. Второе. Прогноз от инсайдера из Open AI, который ещё до появления ChatGPT предсказал всё, что сейчас происходит с нейронками.
[10:39]И вот в этом году он выпустил новый прогноз до 27 года. И третье, самое мощное — это мой разбор эссе основателя компании Anthropic, который, по сути, второй человек в мире искусственного интеллекта.
[10:53]Он по полочкам разложил, что будет происходить в мире в ближайшие 5 лет, и главное, каким будет универсальный AI, которого все так боятся или ждут. Переходи по ссылке в описании.
[11:04]И если компьютеры могут делать всё то, чего ты даже не ожидал, и тебе не нужно создавать под какую-то задачу отдельное приложение, неужели приложения просто исчезнут?
[11:13]Думаю, 80% из них исчезнут. Зачем мне нужен MyFitnessPal? Мой агент и так знает, когда я принимаю нервные решения.
[11:45]Мне не нужно фитнес-приложение, потому что он сам планирует всё за меня. Зачем мне список дел?
[11:51]Я просто говорю: напомни мне об этом и об этом, и на следующий день он напоминает. Важно ли мне, где это хранится?
[11:58]Нет, он просто делает своё дело. Любое приложение, которое, по сути, просто управляет данными, агенты смогут заменить более эффективным и естественным способом.
[12:08]Выживут, пожалуй, только те приложения, которым нужны датчики. И если в таком сценарии большинство приложений исчезнет.
[12:17]Останутся ли модели единственным подобием приложений? Не всё исчезнет.
[12:22]Ну да, я думаю, что у крупных компаний-разработчиков моделей есть серьёзное преимущество. Ведь в конечном счёте именно они выдают токены.
[12:33]Оказалось, одна из жалоб — это слишком большой расход токенов. Вам просто очень нравится их использовать.
[12:39]Поэтому вы ими и пользуетесь так часто, сжигая токены. Разве я виноват, что создал нечто настолько популярное?
[12:47]Ну, все модели постоянно обгоняют друг друга, и, возможно, они становятся массовым товаром.
[12:54]Если приложения исчезнут, а модели станут общедоступными, что-то типа когда мозг лобстера можно легко заменить, что тогда останется? В чём будет ценность?
[13:05]В накопленной памяти, в сложности системы, что остаётся? В чём будет ценность?
[13:13]Во-первых, я не думаю, что у разработчиков моделей всегда будет это преимущество. Вы и сами это видите.
[13:21]Выходит новая модель, все в восторге. Боже, как это круто. А через месяц она якобы портится и становится никуда не годной. Мол, её урезали.
[13:30]Но нет, они ничего не делали. Просто вы привыкли к новому стандарту, и ваши ожидания выросли. А модель остаётся на прежнем уровне.
[13:38]Какое-то время вы её любите, а затем она становится стандартом, и на то, что было раньше, уже и смотреть не хочется.
[13:49]У нас есть Open Source решение уровня топовых моделей годичной давности. Все их хейтят, жалуются, что они плохие и скучные.
[13:58]Но ведь это именно то, что мы имели тогда. Через год нынешние технологии станут открытыми, и мы будем ими недовольны, потому что привыкнем к лучшему.
[14:06]Так что в обозримом будущем у гигантов всё ещё есть фора. С точки зрения контроля это будет интересно.
[14:13]Сейчас у каждой компании свой закрытый бункер данных. Не думаю, что есть способ, ну, может, только для европейцев, вытащить свои воспоминания из ChatGPT.
[14:24]По крайней мере, я о таком не знаю. И уж точно нет способа передать их другой компании.
[14:31]Если бы я был сервисом чатов, ты мог бы пользоваться мной, но доступа к тем воспоминаниям у меня бы не было. Компании пытаются привязать тебя к своему хранилищу.
[14:44]А прелесть OpenClaw в том, что он как бы цепляется в данные через конечного пользователя. В итоге ведь именно у пользователя есть доступ, иначе бы ничего не работало.
[14:54]А раз у пользователя есть доступ, значит, я могу до них добраться. И воспоминания принадлежат тебе. Это просто кучка Markdown-файлов на твоём компе.
[15:02]Не я ими владею. Да, каждый сам владеет своими воспоминаниями в виде набора файлов на своём железе. И, честно говоря, это очень личные вещи.
[15:10]Ведь люди используют агентов не только для решения задач, но и для обсуждения личных проблем.
[15:18]Причём очень быстро к этому приходят. Я и сам так делаю. Там есть такие воспоминания, утечки которых я бы точно не хотел.
[15:26]Что бы ты скорее побоялся показать: историю поиска в Google или свои файлы memory.md?
[15:33]Что такое Google? Им ещё кто-то пользуется? В общем, когда я это создал, я был в восторге. Но в Твиттере люди не понимали.
[15:45]У меня не получалось объяснить, в чём крутизна. Это нужно прочувствовать.
[15:54]Я пробовал по-разному, но так и не смог нормально донести суть. И тогда решил: Сделаю-ка я что-нибудь безумное.
[16:03]Я создал сервер в Discord и выложил своего бота в общий доступ безо всяких ограничений безопасности.
[16:10]Люди заходили, общались с ним, видели, как я пишу софт прямо через него, пытались взломать его промпт-инъекциями, а мой агент просто смеялся над ними.
[16:19]Ты же ограничил его своим ID, чтобы он слушался только тебя. Да, да, именно.
[16:24]Плюс прописал очень чёткие инструкции, что остальные опасные, и слушать надо только меня. Но отвечать он должен всем.
[16:32]И где хранились эти инструкции? Это важная часть самого OpenClaw. Это часть системного промпта.
[16:41]Он объясняет: Ты в Discord'е, там есть посторонние люди, но слушаешься ты только своего владельца. Не знаю даже, как я это сформулировал.
[16:50]Твоего бога. Я строил систему очень органично.
[16:58]В какой-то момент я создал файлы identity.md, личность, soul.md, душа, и другие. И только в январе начал делать так, чтобы другим было проще это устанавливать.
[17:15]Я помню, как создавал шаблоны: Посмотри, что у меня есть, и сделай шаблоны. И CodeX их написал.
[17:22]И получилось что-то вроде хлеб. Ну, знаешь, шутят, что CodeX на вкус как пресный хлеб. У них сейчас появился новый дружелюбный голос. Я его ещё не пробовал.
[17:31]Но те новые боты казались такими скучными по сравнению с тем, что было у меня. И я сказал:
[17:37]Мальти, вдохни жизнь. Мальти — это имя твоего персонального. Да, это новое имя. Со старым возникли некоторые юридические сложности.
[17:45]То есть ты разговаривал с Мальти? Да, я сказал ему: Наполни эти шаблоны своим характером. И он их переписал.
[17:54]Всё, что получилось в итоге, было реально забавным. Не настолько смешные, как мои оригиналы, поэтому кое-что я оставил в секрете.
[18:03]Единственный файл, который я не выложил в открытый доступ — это soul.md, душа. И хотя мой бот висит в публичном Discord'е, этот файл пока не скрыли.
[18:12]Расскажи подробнее про soul.md. Я видел исследования от Anthropic, кажется. Оно уже в открытом доступе, но пару месяцев назад было секретным.
[18:21]Там кто-то случайно обнаружил текст, скрытый в весах модели. Она не помнила, что учила его, но он был вшит в её основу как некая конституция.
[18:34]Меня это дико заворожило. Мы обсудили это с моим агентом и создали soul.md с базовыми ценностями.
[18:41]Как мы видим взаимодействие человека и ИИ? Что важно мне? Что важно модели? Местами там, конечно, какая-то эзотерика и бессмыслица.
[18:54]Но есть и реально ценные вещи, благодаря которым модель реагирует на текст очень естественно. В вопросах разработки OpenClaw ты тоже порой идёшь против течения.
[19:04]Твой выбор модели для кодинга, то, на чём ты запускаешь бота, и сам процесс написания кода. Сейчас популярный GitWorktree.
[19:14]Всё больше инструментов их поддерживают. Но ты говоришь: никаких Worktree. Просто несколько копий репозитория в разных папках и куча окон терминала. Расскажи про свой подход.
[19:26]Да, мне кажется, сейчас весь мир помешан на Claudcode. Я обожаю CodeX, потому что он просматривает гораздо больше файлов, прежде чем решить, что именно изменить.
[19:40]Тебе не нужно устраивать танцы с бубном, чтобы получить нормальный результат. Если ты опытный водитель, то выжмешь максимум из любого инструмента.
[19:51]Но CodeX, он просто, он просто великолепен. Он невероятно медленный. Поэтому я иногда запускаю по 10 штук одновременно.
[20:00]Штук шесть на одном экране, по паре на других. Это и так создаёт приличную когнитивную нагрузку. Приходится постоянно переключаться.
[20:10]Поэтому я стараюсь минимизировать сложность во всём остальном. В моей голове ветка Main всегда должна быть готова к отправке.
[20:18]У меня просто несколько копий одного и того же репозитория, и все на ветке Main. Мне не нужно думать, как назвать ветку.
[20:25]Не нужно бояться конфликтов имён. В Worktree есть свои ограничения, о которых мне не нужно париться, если это просто копии папок.
[20:37]И я не люблю графические интерфейсы. Это, опять же, лишняя сложность. Чем меньше трения и препятствий, тем лучше. Всё, что меня волнует — это синхронизация и текст.
[20:50]Мне не обязательно видеть весь код целиком. Обычно он просто проносится перед глазами. Иногда попадаются действительно заковыристые куски, которые я хочу изучить лично.
[20:59]Но в большинстве случаев, если ты чётко понимаешь архитектуру, синхронизируешь её и обсуждаешь с агентом, всё в порядке.
[21:07]А ещё я очень рад, что даже не стал встраивать поддержку MCP. OpenClaw очень успешен, и в нём нет нативной поддержки MCP.
[21:14]С небольшой оговоркой. Я создал навык, использующий MacPort. Это один из моих инструментов, который превращает MCP в обычные CLI-утилиты, интерфейс командной строки.
[21:24]Так что можно использовать любой MCP как CLI. Но я полностью пропустил всю эту классическую чехарду с протоколами.
[21:32]Благодаря этому, тебе не нужно перезагружаться, в отличие от того же Cursor или CloudDev, где приходится перезапускать всё приложение. Это гораздо элегантнее и лучше масштабируется.
[21:44]Посмотрите на Anthropic. Они создали инструмент поиска. Что-то очень специфическое под MCP, что долго было в бете, потому что это жутко сложно.
[21:56]А у меня просто CLI. Бот отлично шарит в Unix. У тебя может быть сколько угодно таких утилит, и всё просто работает.
[22:05]Я очень доволен, что жалоб на отсутствие MCP почти нет. Получается, ты просто даёшь ему те инструменты, которыми любят пользоваться люди.
[22:15]Именно. И не изобретаешь велосипед специально для ботов. Ни один человек в здравом уме не станет вызывать MCP вручную.
[22:23]Да, все просто хотят использовать командную строку. За этим будущее. Я только за. Спасибо большое, что нашёл время прийти и поболтать.
[22:32]Это было очень вдохновляюще. Когда мы переписывались последние пару лет, я видел, как ты возвращаешься в игру. Питер, то, что ты сделал.
[22:38]Этот странный Wipe Tunnel и прочее, на что никто не обращал внимания. Ты буквально гнался за своей мечтой.
[22:47]И я просто в восторге от того, что происходит сейчас. И, конечно, это должен был быть кто-то вроде одиночки из какой-то крошечной страны, далёкой от Кремниевого острова, чтобы принести всё это нам.
[22:58]Ты огромное вдохновение. Спасибо, Питер.



