在 42章经 中提及的产品。
我在 Character.ai 做 Post Training|对谈前 C.AI 模型应用算法专家 Ted
2024年11月16日 · 1:00:11
本期曲凯对话前Character.ai模型应用算法专家Ted,揭秘C.AI内部运作与后训练最佳实践。Ted解释了商业化停滞源于团队专注AGI而非盈利,并详述SFT、DPO、RLHF三大后训练方法及数据飞轮的关键作用。他分享了硅谷多模型混用现状、O1对推理侧启示,以及华人创业者迎来百年难遇的机遇。