我在 Character.ai 做 Post Training｜对谈前 C.AI 模型应用算法专家 Ted

2024年11月16日 · 1:00:11

本期曲凯对话前Character.ai模型应用算法专家Ted，揭秘C.AI内部运作与后训练最佳实践。Ted解释了商业化停滞源于团队专注AGI而非盈利，并详述SFT、DPO、RLHF三大后训练方法及数据飞轮的关键作用。他分享了硅谷多模型混用现状、O1对推理侧启示，以及华人创业者迎来百年难遇的机遇。

Entropix

1 个单集