我爱免费 发表于 2025-3-29 14:56

AI 杂谈

作者:微信文章
趁着每天中午午休前的半小时,花了3个月,总算读完了一本人工智能的科普读物。今天就来写一篇读书笔记,谈谈自己的一些臆想,或是收获。说到读书笔记,这个概念变得陌生了。细数下来,上次写读书笔记还要追溯到参加工作前。但到了AIGC(AI创作)爆发式发展的现在,各种5分钟快速经典层出不穷。倘若真花个几天读完一本书,再花半小时回顾,从时间的性价比而言,好像还真比不上抛给AI。毕竟,同样产出的是精炼后的故事脉络,同样披露的是略有哲思的人生思考。我说不出这两者是否有高下之分,但就个人经验而言,每个人的学习模式有所不同。有的人是谈话高手,在谈笑间,就能引出真知灼见,并能化为己用。有的人是工匠,读书百遍,依然抵不过抡起铁锤,实实在在地真金火炼。还有的人是书记员,听千道看万遍,倘若不用自己的语言重新组织一道,都是雁过无痕。不幸,我好像就是那位书记员。我尝试让各种AI在我耳边念经,但依然不得其法。初识LLM(大语言模型),我惊叹于其竟真能从汪洋的文本里,穿针引线,织出华丽的句章。但后来就乏了,一是它看似言之凿凿,实则信口开河,二是现在的LLM多数是实用主义倾向,一想到在工作之余,还要面对MECE,总分总,一二三各种汇报文学,我就头疼。回到正题,既然我无法从与AI对话中,习得我想要的知识。那只能重拾笨方法,找一本合适的读物,来对AI有个完整的认知全貌。而这本书,便是周志明的《智慧的疆界:从图灵机到人工智能》。看完后,会对当前的AI发展有些祛魅。当下的所有成就,都只是数理统计的具象化。卷积神经网络也好,深度信念网络也罢,背后都离不开线性代数。无论是半监督式学习,还是无监督式学习,都少不了投喂尽可能多的数据。不同于上世纪的符号主义学派,力图从一个个先验的知识推导出万物,当前通过模仿人脑结构而演化出的神经网络算法,完完全全是一个黑匣子。在一阵数据训练之后,我们能得到ABC是X的特征,但AI不会告诉我们为什么是ABC。一切的意义解释权仍在人类手上。在这一轮AI应用热潮中,AIGC无疑是最为瞩目的那个。注意力机制的引入,让AI更快地攻克了长文本。而最新发布的GPT-4o,宣告AI拥有了对概念的“理解能力”。AI能对人类捏造出的概念,进行理解,并做出二次创作。所有的内容创作者,都无法再对AI避而不见了。

这个世界好像在朝着巴特的「文本互涉」理论演进。“所有的文本都只不过是铺天盖地巨大意识网络上的一个节点,它与四周的牵连千丝万缕,无一定向。作者的丧钟已然敲响,一部作品的问世,只不过是意味着一道支流融入了意义的汪洋,增加了新的水量,又默默接受了大海的倒灌。”文本不再是私有的,任何人都能用相同的提示词,通过同一Agent造访相同的文本花园。作者不再创作新的文本,他只是「造访」,借助AI,从万千词句的抽屉里抽出自己满意的词句。AI看似无所不能,但还是回到前面一开始提出的观点。当下的所有成就,都只是数理统计的具象化。我们在用尽可能多的观测样本,找到一个概率最大的行动可能。这意味着,AI只能寄生于人类社会产生的数据世界,按这个思路发展下去,它仍然只是工具。只是这工具,越来越耀眼地,无法视而不见。它将重塑我们的行为习惯。可以预见的是,电影Her里的场景,会离我们的现实越来越近。到时,我能混一口饭吃吗? 就以情感书信员的角色。 笑。

以下,真读书笔记
理解了一下最近的Manus, 核心依然由工具层 + 基于LLM的AI Agent + 工作流框架 + 记忆体组成。显眼之处是其交互,基于R1的那套推理逻辑,把工作步骤拆解,并且可视化给到用户。有点Cursor的影子。

拿公司做类比:

一线执行者是种种工具, 各个管理者是AI Agent, 组织结构和企业愿景是工作流,通过与市场的反馈交互形成的各种文档是记忆体。

市场需求输入 -> 经过工作流上的各个AI Agent, 拆解成行动指令 -> 给到工具应用去执行 -> 结果输出到市场 -> 吸收市场反馈录入记忆体,让Agent能迭代相同场景的需求拆解逻辑。

一样的问题是科层关系复杂后,带来的累计AI幻觉,让输出失真。
页: [1]
查看完整版本: AI 杂谈