AI法律评论丨DeepSeek开源最强推理模型R1 AI顿悟时刻出现

我爱免费 · 发表于 2025-1-24 08:39

作者：微信文章

文丨天元律师事务所李昀锴

审定丨主管合伙人孙彦

1、DeepSeek开源最强推理模型R1 AI顿悟时刻出现

1月20日，国内大模型公司深度求索（DeepSeek）在其公众号公布了新一代开源大模型DeepSeek-R1，该模型号称在数学、代码、自然语言推理等任务上，性能比肩美国OpenAI公司最新的o1大模型正式版。

根据数据，DeepSeek-R1在算法类代码场景（Codeforces）和知识类测试（GPQA、MMLU）中的得分略低于OpenAI o1，但在工程类代码场景（SWE-Bench Verified）、美国数学竞赛（AIME 2024, MATH）项目上，均超过了OpenAI o1。

其中，与深度求索上月发布的大模型DeepSeek-V3相比，DeepSeek-R1在AIME 2024和Codeforces中的得分提升了近一倍，而其余项均有不同程度的提升。

深度求索还更新了用户协议，明确模型开源License将统一使用标准的MIT许可，同时还允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。按照深度求索数据显示，在以DeepSeek-R1基础上进行“蒸馏”的6个小模型中，32B和70B模型在多项能力上都实现了对标OpenAI的o1-mini的效果。（来源：观察者网）

评论：DeepSeek-R1在性能上能与OpenAI的o1大模型相媲美，且在部分项目上实现超越，这是深度求索对自身智力成果的重大突破，通过技术创新形成了具有独特价值的大模型，在中美技术竞争的背景下，显著的增强了中国在全球AI领域的竞争力。

作为法律从业者，我们更关注DeepSeek的开源情况。传统软件开源是公开其软件的全部源代码，其他开发者可以参与该软件代码开发、迭代。而对AI模型而言，可以开源的包括模型训练源代码、参数权重、训练数据等。但当前多数AI开源模型的开发者通常仅仅开源参数权重，而训练源代码、训练数据等均未开源，这就导致其他开发者无法了解该模型的训练原理，也无法对开源模型进行改进及优化。

本次R1模型权重及蒸馏后的多个版本均全部开源，并附有详细的部署指南，Deepseek还发布了完整的技术论文，详细披露了强化学习（RL）训练流程、GRPO算法设计等。在开源协议方面，Deepseek采用宽松的MIT许可证，允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。DeepSeek-R1的开源实践标志着AI模型开源从“形式开放”向“实质透明”的转型，其技术细节的全披露、许可的灵活性与生态共建导向，不仅回应了“开源作秀”的质疑，更为行业树立了技术共享与商业化平衡的新标杆，这对整个AI行业的影响是非常重大的。我们深深的为Deepseek这一国产开源模型而感到骄傲。

2、愈来愈多的美国青少年使用ChatGPT完成作业

根据皮尤研究中心最近公布的调查，愈来愈多的美国青少年使用ChatGPT完成作业。调查结果显示，13-17岁学生中有26%使用AI机器人帮助完成作业，两倍于2023年的13%；54%的学生认为使用AI工具研究新主题是可接受的用途，18%的学生认为使用AI写作文是可接受的，29%学生认为用AI解数学题是可接受的；15%-21%的学生对上述任务表示不确定。11年级和12年级的青少年（31%）比七年级和八年级学生（20%）更可能在家庭作业使用ChatGPT，79%的青少年听说过ChatGPT，高于2023年的67%。（来源：Solidot）

3、腾讯上线AI生成内容鉴别工具

腾讯混元安全团队朱雀实验室推出AI生成图片检测系统及文本检测系统。2024年AI深度赋能各行业，带来信任危机。该检测系统通过捕捉真实图片与AI生图的差异进行鉴别，如不符合常识逻辑、需“加水印”以及包含隐层特征等。检测系统利用140万份正负样本训练模型，涵盖多种生成内容场景，测试检出率达95%以上且持续优化。（来源：腾讯）

评论：AI工具便利了很多人的工作、生活，但其提高生产效率的同时也滋生了洗稿、诈骗、学术造假等问题。相较于对AI生成的研究及推广，AI生成内容检测的研究显然还有很大不足。此前英国雷丁大学的一项研究发现,在大学考试中,有94%的AI生成内容完全没有被老师发现。

腾讯作为头部企业推出检测工具，客观上可能推动行业形成AI内容标识的“事实标准”，也可以视为对《人工智能生成合成内容标识办法（征求意见稿）》合规要求的提前落实。若未来《人工智能生成合成内容标识办法》的标识义务最终落地，此类技术将直接服务于合规需求。比如在社交媒体平台上，当用户发布由AI生成的虚假新闻图片或文字时，该工具可迅速发出警示，平台运营者便能及时采取措施，如删除虚假内容、限制发布者账号等，从而有效切断虚假信息的传播链条。

在另一方面，该类检测工具将来可作为重要证据形式，帮助司法机关更准确地认定事实。例如此前网络上发生购买美术作品怀疑是AI生成而非艺术家创作的相关纠纷，如果该工具可以广泛应用，或将有效的确认交易的美术作品是否符合合同约定，能够成为司法实践中重要的辅助证据。

4、《逆水寒》手游打造全球首个AI游戏竞技场

近日，手游《逆水寒》在AI应用领域引发广泛关注，该游戏更新后AI浓度大幅提升，新增多位特色“AI娘”及“AI大模型竞技场”玩法，成为游戏与AI融合的创新典范。

《逆水寒》的AI大模型竞技场于去年11月上线，采用盲评机制，玩家在互动中对模型表现进行评价投票，其参与人数与有效投票数在短时间内跃居全球第一。此竞技场吸引了阿里、百度、MiniMax、月之暗面、字节跳动等国内头部AI厂商入驻，其通义、文心、abab、Kimi和豆包等模型纷纷亮相，化身“AI娘”参与竞争，如“千问”“星尘”等，她们各具性格与才艺，为游戏增添别样色彩。

该游戏凭借自身优势为AI测试提供理想场景。其丰富的NPC互动环节契合大型语言模型的角色扮演特性，RPG游戏的沉浸式体验与社交功能有效解决了传统AI竞技场用户参与不足的问题，吸引了多元用户群体参与评价，推动AI技术在复杂情境下的发展。（来源：机器之心）

评论：游戏与AI技术显然是天作之合，AI技术能塑造智能NPC，依据玩家行为动态调整策略，也可用于生成游戏内容，像地形、关卡等，还能实现智能匹配，依据玩家水平匹配对手。《逆水寒》被很多媒体称为首款AI游戏，提供了AI江湖友人、AI副本队友、AI剧组模式、AI捏脸染色、AI自定义语音、AI大宋头条、AI作诗作画等玩法，极大提升了游戏的可玩性。

目前《逆水寒》的竞技场，对各大模型提供了海量的真实用户反馈数据。众多玩家与AI的互动以及对其表现的评价，能让开发者精准地了解模型在实际应用中的优缺点，例如在语言理解、逻辑推理、情感表达等方面的不足，进而有针对性地进行优化和迭代。这种用户反馈是宝贵且真实的，AI技术进化已不再是单纯参数竞赛，而是更符合用户的实际需求、反馈用户的真实需要。也许，未来的游戏可能会进化出我们无法想象的形态。

*特别声明：

本文仅为交流目的，不代表天元律师事务所的法律意见或对法律的解读，如您需要具体的法律意见，请向相关专业人士寻求法律帮助。

账号		自动登录	找回密码
密码			注册

萍聚头条

AI法律评论丨DeepSeek开源最强推理模型R1 AI顿悟时刻出现

本帖子中包含更多资源