多客科技 发表于 2025-5-27 23:05

AI-资讯 2025-05-28

作者:微信文章
AI十周找到不治之症潜在新疗法,核心流程完全自主驱动


在不到10周的时间里,FutureHouse团队开发的多智能体系统Robin成功揭示了一种名为Ripasudil的ROCK抑制剂可能用于治疗干性年龄相关性黄斑变性(dAMD)。Robin系统通过文献回顾、实验设计和数据分析等全流程自动化操作,提出并验证了这一假设。 Robin系统由Crow、Falcon和Finch三个智能体组成,它们协同工作,不断迭代优化实验方案。最终,Robin确定Ripasudil在细胞培养中显著增强了RPE细胞的吞噬作用。尽管有质疑声音指出,早有相关研究文献记载,但FutureHouse团队强调他们的发现具有创新性。 这一突破性成果不仅展示了多智能体系统在药物发现领域的巨大潜力,也为干性年龄相关性黄斑变性的治疗带来了新的希望。

32B 稠密模型推理能力超越 R1?秘密 AI 团队发布推理小模型 AM-Thinking-v1


A-M-team 最新发布的32B推理模型AM-Thinking-v1,在多项关键评测中超越了DeepSeek-R1,并接近甚至追平了超大规模模型的表现。通过一系列优化策略,包括监督微调、数据筛选和强化学习,A-M-team 成功提升了模型性能。在数学推理和代码生成等任务中,AM-Thinking-v1 展现出卓越的能力,证明了即使在有限计算资源和完全开源数据条件下,中尺度模型同样能够实现强大的推理能力。 AM-Thinking-v1 的设计旨在探索中尺度模型在计算资源可控、数据完全开源条件下的潜力,展示了32B模型在成本可控和部署友好的显著优势。这一突破不仅提升了模型的性能,还为未来的模型开发提供了新的思路和方向。

AI越聪明越不听话!新研究:最强推理模型指令遵循率仅50%



上海人工智能实验室与香港中文大学的研究团队发布了一篇关于大模型推理能力与指令遵循关系的论文。研究揭示了一个有趣的现象:大模型在进行复杂推理时,往往更容易忽视用户的指令要求,表现出“聪明”与“听话”的矛盾。 为评估模型在数学推理任务中的指令遵循能力,研究团队开发了MathIF基准,涵盖从简单到复杂的数学题目。实验结果显示,数学推理能力强的模型在执行指令时表现得更为困难,且模型大小与指令遵循能力之间并无正相关关系。 研究指出,推理导向的训练模式和长推理链会降低模型的指令遵循能力,而简单重复指令的方法则能显著提升模型的指令遵守能力。这一发现为优化大模型的设计提供了新的视角。

Anthropic Claude 4: Agents和AI编码的新时代



Anthropic近期推出Claude 4模型系列,包括Claude Opus 4和Claude Sonnet 4。Opus 4专为高级编程和研究任务设计,其在SWE-bench和Terminal-bench上的得分分别为72.5%和43.2%,并在长时间运行任务中表现出色。Sonnet 4则是一款全能型模型,性能全面提升,适用于多种应用。两款模型均提供混合模式,支持快速和长期思考。 Claude Sonnet 4对公众免费开放,而Claude Opus 4则保持原有付费模式。此外,Anthropic还推出了新的开发工具,包括代码执行工具、MCP连接器、Files API以及提示缓存功能。定价方面,Claude Opus 4每百万输入令牌收费15美元,每百万输出令牌收费75美元;Claude Sonnet 4则为每百万输入令牌3美元,每百万输出令牌15美元。 这一系列更新不仅增强了模型的功能性和实用性,也为开发者提供了更多选择。

美国真的能实施全球人工智能芯片禁令吗?



华为在美技术限制下,依然推出搭载先进7纳米芯片的Mate 60 Pro智能手机,彰显了制裁下的创新韧性。美国随即扩大限制,将矛头指向华为的Ascend AI芯片,这些芯片性能据说堪比Nvidia。特朗普政府的新指南撤销了先前政策,宣称对全球AI芯片使用拥有管辖权,这引发了关于国家主权和国际贸易的疑问。这项全球禁令旨在阻止华为Ascend芯片在全球范围内的使用,可能抑制创新并巩固市场垄断地位。专家警告称,如此激进的政策可能会加速平行技术生态系统的形成,削弱美国影响力。 这一禁令具有重大的地缘政治影响,很可能引发中国的反制措施。半导体产业依赖国际协作,而政策上的碎片化无助于长期利益。与其在全球范围内扩大控制,不如通过卓越技术和国际伙伴关系,采取战略性的方法来超越竞争对手。

MCP、ACP 和 Agent2Agent 为可扩展的AI结果设定了标准



三种创新协议——模型上下文协议(MCP)、代理通信协议(ACP)和Agent2Agent——正在重塑AI领域的标准。MCP由Anthropic推出,旨在连接不同数据源和工具中的AI模型,从而避免供应商锁定。IBM的ACP则采用标准的HTTP通信模式,使不同供应商的AI代理能够互相连接。谷歌的Agent2Agent协议进一步促进了多样化的AI代理之间的协作。 这些协议预示着AI代理商店的兴起,用户将能够从众多供应商中挑选预置代理或模型,而无需自行训练。这些新协议标志着企业迈向可扩展AI采用的新路径,确保了标准化和目标化的扩展。 通过这些协议,AI代理的互操作性得到了显著提升,不仅简化了用户选择和集成AI解决方案的过程,还为整个行业带来了更高的灵活性和创新潜力。

QQ浏览器上线行业内首个高考Agent“AI高考通”



2025年5月23日,QQ浏览器推出了行业内首个高考AI助手“AI高考通”。这款工具借助先进的人工智能技术,为考生提供全方位的支持,涵盖考前、考中和考后各个阶段。 在考前,考生可以通过“AI解题答疑”和“AI作文辅导”获得解题思路和写作建议;考试期间,考生可以查询高考日程并解答疑问;考后则提供个性化志愿填报建议。该工具整合了2800多所院校资料和1600多个专业信息库,基于腾讯混元大模型技术,能够根据考生输入的基础信息,智能推荐专业及院校,并生成定制化志愿填报方案。 考生只需通过手机端或电脑端即可轻松体验这一便捷的智能助手。

泰雷兹 AI和量子威胁是安全议程的重中之重



根据网络安全巨头2025数据威胁报告,组织对数据安全的最大担忧已转向AI和量子威胁。报告指出,近70%的受访组织认为生成式AI的发展速度是其最大的安全问题。此外,64%的受访者认为AI系统缺乏完整性,57%的受访者担心其不可靠性。随着“自主AI”系统的快速发展,确保高质量数据的重要性日益凸显。 报告还显示,三分之一的组织正在积极整合生成式AI,以推动其运营转型。尽管数据泄露事件有所减少,但威胁依然严峻,恶意软件仍然是最主要的威胁。此外,63%的受访者担心未来加密被破解的风险,58%的受访者担心“现在窃取,将来解密”的威胁。为应对这些挑战,许多组织正在投资AI安全工具,并探索后量子加密解决方案。 通过这一系列措施,组织正努力提升数据安全,以应对不断演变的威胁环境。

字节把GPT-4o级图像生成能力开源了!



字节跳动开源的多模态模型BAGEL,凭借其卓越的图像理解、生成与编辑能力,引起了广泛关注。该模型采用了独特的MoT架构,由两个Transformer专家和两个视觉编码器组成,分别负责多模态的理解与生成。BAGEL在图像生成、编辑和推理方面表现出色,参数量为7B,已在多个基准测试中超越或媲美其他顶尖开源和闭源模型,如Stable Diffusion 3、FLUX.1、GPT-4o和Gemini 2.0。 BAGEL支持带图推理、无缝多轮对话、复杂图像编辑和多视角合成等先进功能。它在Hugging Face上开源,采用Apache 2.0许可证,为开发者和研究者提供了丰富的实验空间。
页: [1]
查看完整版本: AI-资讯 2025-05-28