|
作者:微信文章
文丨天元律师事务所 李昀锴
审定丨主管合伙人 孙彦
1、DeepSeek开源最强推理模型R1 AI顿悟时刻出现
1月20日,国内大模型公司深度求索(DeepSeek)在其公众号公布了新一代开源大模型DeepSeek-R1,该模型号称在数学、代码、自然语言推理等任务上,性能比肩美国OpenAI公司最新的o1大模型正式版。
根据数据,DeepSeek-R1在算法类代码场景(Codeforces)和知识类测试(GPQA、MMLU)中的得分略低于OpenAI o1,但在工程类代码场景(SWE-Bench Verified)、美国数学竞赛(AIME 2024, MATH)项目上,均超过了OpenAI o1。
其中,与深度求索上月发布的大模型DeepSeek-V3相比,DeepSeek-R1在AIME 2024和Codeforces中的得分提升了近一倍,而其余项均有不同程度的提升。
深度求索还更新了用户协议,明确模型开源License将统一使用标准的MIT许可,同时还允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。按照深度求索数据显示,在以DeepSeek-R1基础上进行“蒸馏”的6个小模型中,32B和70B模型在多项能力上都实现了对标OpenAI的o1-mini的效果。(来源:观察者网)
评论:DeepSeek-R1在性能上能与OpenAI的o1大模型相媲美,且在部分项目上实现超越,这是深度求索对自身智力成果的重大突破,通过技术创新形成了具有独特价值的大模型,在中美技术竞争的背景下,显著的增强了中国在全球AI领域的竞争力。
作为法律从业者,我们更关注DeepSeek的开源情况。传统软件开源是公开其软件的全部源代码,其他开发者可以参与该软件代码开发、迭代。而对AI模型而言,可以开源的包括模型训练源代码、参数权重、训练数据等。但当前多数AI开源模型的开发者通常仅仅开源参数权重,而训练源代码、训练数据等均未开源,这就导致其他开发者无法了解该模型的训练原理,也无法对开源模型进行改进及优化。
本次R1模型权重及蒸馏后的多个版本均全部开源,并附有详细的部署指南,Deepseek还发布了完整的技术论文,详细披露了强化学习(RL)训练流程、GRPO算法设计等。在开源协议方面,Deepseek采用宽松的MIT许可证,允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。DeepSeek-R1的开源实践标志着AI模型开源从“形式开放”向“实质透明”的转型,其技术细节的全披露、许可的灵活性与生态共建导向,不仅回应了“开源作秀”的质疑,更为行业树立了技术共享与商业化平衡的新标杆,这对整个AI行业的影响是非常重大的。我们深深的为Deepseek这一国产开源模型而感到骄傲。
2、愈来愈多的美国青少年使用ChatGPT完成作业
根据皮尤研究中心最近公布的调查,愈来愈多的美国青少年使用ChatGPT完成作业。调查结果显示,13-17岁学生中有26%使用AI机器人帮助完成作业,两倍于2023年的13%;54%的学生认为使用AI工具研究新主题是可接受的用途,18%的学生认为使用AI写作文是可接受的,29%学生认为用AI解数学题是可接受的;15%-21%的学生对上述任务表示不确定。11年级和12年级的青少年(31%)比七年级和八年级学生(20%)更可能在家庭作业使用ChatGPT,79%的青少年听说过ChatGPT,高于2023年的67%。(来源:Solidot)
3、腾讯上线AI生成内容鉴别工具
腾讯混元安全团队朱雀实验室推出AI生成图片检测系统及文本检测系统。2024年AI深度赋能各行业,带来信任危机。该检测系统通过捕捉真实图片与AI生图的差异进行鉴别,如不符合常识逻辑、需“加水印”以及包含隐层特征等。检测系统利用140万份正负样本训练模型,涵盖多种生成内容场景,测试检出率达95%以上且持续优化。(来源:腾讯)
评论:AI工具便利了很多人的工作、生活,但其提高生产效率的同时也滋生了洗稿、诈骗、学术造假等问题。相较于对AI生成的研究及推广,AI生成内容检测的研究显然还有很大不足。此前英国雷丁大学的一项研究发现,在大学考试中,有94%的AI生成内容完全没有被老师发现。
腾讯作为头部企业推出检测工具,客观上可能推动行业形成AI内容标识的“事实标准”,也可以视为对《人工智能生成合成内容标识办法(征求意见稿)》合规要求的提前落实。若未来《人工智能生成合成内容标识办法》的标识义务最终落地,此类技术将直接服务于合规需求。比如在社交媒体平台上,当用户发布由AI生成的虚假新闻图片或文字时,该工具可迅速发出警示,平台运营者便能及时采取措施,如删除虚假内容、限制发布者账号等,从而有效切断虚假信息的传播链条。
在另一方面,该类检测工具将来可作为重要证据形式,帮助司法机关更准确地认定事实。例如此前网络上发生购买美术作品怀疑是AI生成而非艺术家创作的相关纠纷,如果该工具可以广泛应用,或将有效的确认交易的美术作品是否符合合同约定,能够成为司法实践中重要的辅助证据。
4、《逆水寒》手游打造全球首个AI游戏竞技场
近日,手游《逆水寒》在AI应用领域引发广泛关注,该游戏更新后AI浓度大幅提升,新增多位特色“AI娘”及“AI大模型竞技场”玩法,成为游戏与AI融合的创新典范。
《逆水寒》的AI大模型竞技场于去年11月上线,采用盲评机制,玩家在互动中对模型表现进行评价投票,其参与人数与有效投票数在短时间内跃居全球第一。此竞技场吸引了阿里、百度、MiniMax、月之暗面、字节跳动等国内头部AI厂商入驻,其通义、文心、abab、Kimi和豆包等模型纷纷亮相,化身“AI娘”参与竞争,如“千问”“星尘”等,她们各具性格与才艺,为游戏增添别样色彩。
该游戏凭借自身优势为AI测试提供理想场景。其丰富的NPC互动环节契合大型语言模型的角色扮演特性,RPG游戏的沉浸式体验与社交功能有效解决了传统AI竞技场用户参与不足的问题,吸引了多元用户群体参与评价,推动AI技术在复杂情境下的发展。(来源:机器之心)
评论:游戏与AI技术显然是天作之合,AI技术能塑造智能NPC,依据玩家行为动态调整策略,也可用于生成游戏内容,像地形、关卡等,还能实现智能匹配,依据玩家水平匹配对手。《逆水寒》被很多媒体称为首款AI游戏,提供了AI江湖友人、AI副本队友、AI剧组模式、AI捏脸染色、AI自定义语音、AI大宋头条、AI作诗作画等玩法,极大提升了游戏的可玩性。
目前《逆水寒》的竞技场,对各大模型提供了海量的真实用户反馈数据。众多玩家与AI的互动以及对其表现的评价,能让开发者精准地了解模型在实际应用中的优缺点,例如在语言理解、逻辑推理、情感表达等方面的不足,进而有针对性地进行优化和迭代。这种用户反馈是宝贵且真实的,AI技术进化已不再是单纯参数竞赛,而是更符合用户的实际需求、反馈用户的真实需要。也许,未来的游戏可能会进化出我们无法想象的形态。
*特别声明:
本文仅为交流目的,不代表天元律师事务所的法律意见或对法律的解读,如您需要具体的法律意见,请向相关专业人士寻求法律帮助。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?注册
x
|