《为什么DeepSeek-R1能做到又好又快又便宜?和漫森博士畅聊,你想知道的都在这》


订阅分享小宇宙APP,倾听Coach8节目

本期节目探讨了近期引起巨大轰动的AI新秀Deepseek。与传统AI模型相比,Deepseek不仅表现优异,还大幅降低成本,吸引了众多关注。这款由国内团队开发的新模型,在短时间内用低成本实现了高效性能,甚至对英伟达的股价产生了影响。节目中邀请了AI专家曼森,深入分析了Deepseek的技术优势和市场影响,探讨了其对业内巨头的冲击及未来发展潜力。


【时间线】

00:02:01:NVIDIA股票下跌百分之七!二一事件引发轰动,大数据专家解析真相!
00:04:32:Deepseek-R1:人工智能的狠毒与智慧,你敢试吗?
00:09:05:“皇帝的新衣”揭穿了:Deepseek-R1在翻译领域的崛起与影响力
00:13:37:研究团队的创新突破:打造强大而低调的技术底座
00:18:13:他所使用的技术和方法:理解、训练和使用深度神经网络的混合专家结构
00:22:47:美籍华裔创业者的背后故事:从GPT到Deepseek-R1,他的公司扮演了什么角色?
00:27:18:沙滩上的探索者:追寻真理与创新的旅程
00:31:53:Deepseek-R1开源的可能性:代码可被修改和扩展的挑战与机遇
00:36:26:深入探讨DEEPC:一个推理型大模型的应用前景与挑战
00:40:56:新一代AI模型Deepseek-R1:速度更快、内存占用更低的机器学习利器
00:45:33:开源的Deepseek-R1模型:超越GPT的性能和能力
00:50:08:马斯克与奥特曼:追求更大的目标与初心的冲突


【摘要】

AI模型Deepseek R的影响与讨论
在新年之际,节目组决定录制一期关于Deepseek-R1的节目。Deepseek-R1在海外引起了巨大轰动,包括凤凰卫视、官媒、CNN等都在报道此事。NVIDIA的股票也受到了影响,下跌了7%。节目组请来了一位大数据专家,他在人工智能方向研究非常有造诣。这位专家表示,Deepseek-R1在AI方面有很多应用,尤其是在电商公司中。他还提到,Deepseek-R1在理解能力上有所提升,能够更好地基于用户给定的信息进行思考。

AI模型的深度与广度探索
这段内容主要讲述了讲者对美团广告TVC的看法,虽然广告的传播量和点赞量很高,但讲者认为美团的价值观让他无法喜欢上这个品牌。同时,讲者提到了一个名为DeepSick的人工智能模型,它能够写出深度讽刺和谎言的文章,让人感到非常聪明。讲者在使用过程中发现,模型在回答深度问题时表现出色,但回答简单问题时效果一般。因此,讲者认为在评价模型时,不能只看其回答普适问题的能力,还要关注其在解决深度问题上的表现。

智能翻译模型与成本效益分析
这段内容主要讲述了Deep Stick模型的一些优势,如翻译速度快、效果好、价格便宜等。与传统的大模型相比,Deep Stick在训练成本、硬件配置和价格上都具有明显优势。此外,Deep Stick还开源了其技术,使得其他公司可以借鉴和复制。虽然有人质疑Deep Stick是否抄袭了Open AI的技术,但开源的特性使得这种行为在情理之中。总的来说,Deep Stick在价格和性能上都非常友好,对于智能体验来说具有很大的吸引力。

深度思考中国AI公司的崛起
这段内容主要讲述了deepseek公司及其创始人,他们开发了一种新的AI模型,具有高效、便宜、广泛的适用性等特点。尽管目前市场上有很多类似的AI模型,但deepseek公司的模型在训练时采用了混合专家结构,每次激活的参数量只有370亿,从而大大减少了资源消耗。此外,deepseek公司的创始人非常低调,他们专注于技术创新,而不是追求市场化的速度。因此,他们的产品在用户感知方面可能会有更好的表现。

AI模型深度思考与实际应用
讨论了Tessy和DeepSeek两种AI模型的特点。Tessy使用多目标训练方式,逻辑自洽性较好,同时采用混合精度减少成本。DeepSeek则采用了实时调度和强化学习的方式,通过专家经验和常识校正输出,使其更符合常识和生活情景。此外,会议还提到了曼森作为大数据专家在电商供应链和新能源产业链方面的专业度。最后,提到了DeepSeek的横空出世,可能对整个AGI速度的到来产生影响。

AGI赛道上的弯道超车与阴谋论
这段内容主要讲述了在AGI赛道上,弯道超车的可能性。讲者认为,与传统制造业不同,AGI领域的弯道超车更容易实现。同时,讲者对某些人的恶意揣测表示不满,认为他们没有必要用恶意去猜测别人。此外,讲者还提到了东西方文化背景的差异,以及每个人对真理的理解和追求。最后,讲者强调了在追求真理的过程中,应该保持谦虚和开放的态度,不断验证和交流。

AI创新与资金影响
这段内容主要讲述了共同愿景、世界真实客观性、创新等方面的问题。首先,对于共同愿景的理解因人而异,无法强求。其次,创新之路往往需要克服资金困难,激发更多创造力。再次,虽然OPEN AI是一家创业公司,但高管薪资过高,与公司的价值观不符,可能导致团队流失。最后,垄断不一定能带来创新,资本的投入可能会导致傲慢和军备竞赛。总之,AI的发展需要理性看待,不能被少数人垄断。

绿色环保与AI技术的弯道超车
讨论了绿色环保和AI概念的提出,以及中国在这些领域的受益情况。同时,提到了基础建设方面的问题,以及OPEN AI和英伟达的合作计划。此外,还探讨了deep模型在应用层面的效果,以及华尔街资本的运作方式。最后,讨论了deep模型在实际应用中的表现,以及如何更好地利用这些技术。

AI应用的挑战与机遇
讨论了AI在应用层面的潜力,认为在算力和模型方面不再成为问题后,中国市场的巨大潜力将得到充分发挥。同时,提到了OPEN AI推出的付费版本O operator,具备计算机视觉功能,可以跨网站运作,帮助用户点餐、住酒店等。此外,还提到了技术人员利用DEEP和GPT等技术实现更多智能体,如跨平台和软件的智能体。会议认为,只要会代码且懂应用场景的人,现在的高薪工作机会将越来越多。

DeepSeek R1的惊人应用实例
推特上博主分享了deepseek R一发布后的十个惊人例子。第一个例子是使用七台Mac mini和一台服务器运行deep R一,说明其对硬件要求低。第二个例子是使用Web GPU在浏览器上运行deep R一,无需写一行代码。第三个例子是deepseek R一在一小时内构建了一个复杂的应用。第四个例子是deepseek R一可以创建带有红球的旋转三角形,而GPT-1无法做到。第五个例子是使用本地运行deep R一构建了实时聊天应用。第六个例子是deepseek R一在浏览器中通过Web GPU百分之百在本地运行。第七个例子是deepseek R一在消费机硬件上实现开源的GPT-1,速度比GPT-1快很多。

DeepSeek模型引发的技术革命
这段内容主要讲述了DeepSeek模型通过提取deepseek的能力,让其他模型变得更聪明,引起了全网的热烈讨论。DeepSeek可以在消费级应用中使用,不需要大量的GPU资源,这对资本强行建立起来的壁垒产生了冲击。同时,DeepSeek的实现让人类在思考和算力方面有了更多的可能性,因为它可以让人在消耗较少能量的情况下解决复杂问题。

AI公司的盈利与初心
马斯克对OPEN AI的转变感到愤怒,因为一开始OPEN AI是计划非盈利的,但现在却变成了盈利性公司,并推出了各种币种。马斯克认为,当一个项目有机会时,人们往往会为了更大的利益而改变初衷。资本的力量使得OPEN AI不得不改变方向,但这可能会导致他们的选择变形。尽管OPEN AI可能会变得很强,但马斯克认为他们的压力一定是巨大的。与此同时,中国也在创造奇迹,再次印证了世界是个草台班子。

AI模型的奖励函数设定与应用
这段内容主要讲述了强化学习在大模型训练中的应用,通过奖励和惩罚机制来引导模型朝着期望的方向发展。同时,提到了人类行为对AI的影响,如果人类的行为是善良的,那么AI也会倾向于行善。但如果输入的数据中有很多犯罪等不良信息,那么AI可能会迷失方向。因此,需要设定一个学习比较的准则,让AI更容易朝着好的方向发展。但同时,这种机制也可能会导致一些变异,最终的结果是好是坏还需要进一步观察。



阅读 413