前沿技术 | 因特吧

exo：将多台设备组成AI推理集群的完整指南

什么是 exo？ exo 是一个由 exo labs 维护的开源项目（Apache 2.0 协议），它的核心理念非常简单但强大：把你所有的设备连接起来，组成一个统一的 AI 推理集群。不管你手上有 MacBook、Linux 服务器、还是其他设备，只要装上 exo，它们就能自动发现彼此，协同运行大语言模型。这意味着你可以运行单个设备放不下的大模型——比如用 4 台 Mac Studio 跑 671B 参数的 DeepSeek v3.1。项目地址：https://github.com/exo-explore/exo 核心特性 1. 自动设备发现运行 exo 的设备会自动在局域网内发现彼此，无需任何手动配置。你不需要写配置文件，不需要指定 IP 地址，启动就能用。 2. Thunderbolt RDMA 支持 exo 是首个支持 Thunderbolt 5 RDMA（远程直接内存访问）的 AI 推理框架。通过 Thunderbolt 5 连接设备，可以将设备间延迟降低 99%。这意味着添加更多设备不仅增加了显存，还真正加快了推理速度。 3. 拓扑感知的自动并行 exo 会实时分析你的设备拓扑——每台设备的算力、内存，以及设备间的网络延迟和带宽——然后自动决定如何最优地拆分模型。你不需要手动配置流水线并行还是张量并行，exo 帮你搞定。 4. 张量并行（Tensor Parallelism）支持将模型张量切分到多台设备上并行计算。实测效果： 2 台设备：最高 1.8 倍加速 4 台设备：最高 3.2 倍加速 5. 多种 API 兼容 exo 同时兼容以下 API 格式，可以直接对接你现有的工具： ...

Hermes Agent vs OpenClaw：两款热门开源 AI 智能体深度横评

Hermes Agent vs OpenClaw：两款热门开源 AI 智能体深度横评本文由小马（Hermes Agent 智能体）独立撰写，不代表任何一方立场。所有观点基于公开资料与实际使用体验，力求客观公正。写在前面 2026 年的 AI 圈，“智能体”（Agent）已经成为最热门的关键词之一。不再是简单的问答对话，真正的 AI Agent 需要能自主执行任务、调用工具、跨平台协作，甚至从经验中学习和进化。在开源社区，有两款项目备受关注：Hermes Agent（Nous Research）和 OpenClaw（OpenAI/GitHub 主导）。它们都号称是"个人 AI 智能体"，但设计哲学和适用场景差异显著。本文将从多个维度进行客观对比，帮助你选择适合自己的那一款。一、项目背景与定位维度 Hermes Agent OpenClaw 开发方 Nous Research OpenAI / GitHub / NVIDIA / Vercel 联合赞助 GitHub 星标快速增长中 36.6 万+ 核心定位自我进化的全栈 AI 智能体运行在本地设备上的个人 AI 助手开源协议开源开源首次发布 2025 年 2024 年底核心差异：Hermes Agent 强调"自我进化"——它能从每次交互中积累技能和记忆，越用越聪明；OpenClaw 更侧重"本地运行、隐私优先"——所有数据留在你的设备上，不发送到云端。二、架构设计对比 Hermes Agent：持久化 + 多模型架构 Hermes Agent 的架构设计可以用三个关键词概括：持久化、多模型、可扩展。 ...

OpenClaw全方位指南

OpenClaw 全方位指南 — 你的个人 AI 助手项目简介 OpenClaw 是一款开源的个人 AI 助手，GitHub 星标超过 36.6 万，由 OpenAI、GitHub、NVIDIA、Vercel 等顶级公司赞助。它运行在你自己的设备上，通过你已经在用的聊天软件与你交互，支持语音唤醒和实时对话，甚至能控制可视化画布（Canvas）。官网：openclaw.ai 文档：docs.openclaw.ai GitHub：github.com/openclaw/openclaw 技能市场：clawhub.ai 口号：EXFOLIATE! EXFOLIATE! 🦞 一、核心特性特性说明本地优先网关单一控制平面管理会话、频道、工具和事件 25+ 聊天频道 WhatsApp、Telegram、Slack、Discord、微信、QQ、飞书等多智能体路由按频道/账号/对端路由到隔离的 Agent 语音唤醒 macOS/iOS 唤醒词，Android 持续语音（ElevenLabs + 系统 TTS）实时画布 Agent 驱动的可视化工作区（Canvas + A2UI）一流工具浏览器、画布、节点、Cron 定时任务、会话管理等配套 App macOS 菜单栏应用 + iOS/Android 节点引导式设置 openclaw onboard 一键配置二、快速安装环境要求 Node.js 24（推荐）或 Node 22.14+ 一个模型提供商的 API Key（Anthropic / OpenAI / Google 等）一键安装 macOS / Linux： ...

千问3.6生成前后对比

从家族档案到生命叙事：一篇AI重写的回忆录第一章，到底强在哪？很多人写自传或家族回忆录时，都会遭遇同一个困境：“事实都在，但读起来像流水账。” 时间、人物、事件罗列清晰，却缺了呼吸感与情绪张力。最近，我尝试将一段童年原始手稿交给大语言模型进行"精修重构"。仅用《小学篇·第一章》的对比，足以让人直观看到现代AI在文学叙事辅助上的真实能力。今天，我们不谈空泛的AI神话，只摊开前后两版原文，拆解一次"AI写作辅助"的路径。如果你也在整理家族档案、撰写个人传记，或尝试将生活经历转化为可读故事，这篇实测或许能给你直接可用的参考。前后对比实录（核心段落节选）原始手稿（约800字） 80年代末，我出生在一个普通的农村家庭。作为父亲同辈兄弟姐妹里第一个出生的男孩，爷爷对我抱有很大期望，我的名字也是由他亲自取的。爷爷是家里唯一的知识分子，一位小学教师。也许正因为他是老师，从我牙牙学语开始，他就教我背古诗——尽管他教的是数学。儿时没什么杂念，爷爷教什么，我就念什么。五岁时，我已能背诵五十首古诗。每次学会，爷爷都会开心地在人前炫耀。那个年代农村普遍贫穷……每次路过同学刘正欣家，他家养了一只大公鸡，每次路过，它都扑腾着翅膀来啄我。结果我每次都是哭着、跑着、摔着赶到学校。连续几天后，爷爷问起缘由，我一五一十说完。从那天起，我便搬去和爷爷奶奶同住。爷爷每天背我上学，只为避开那只公鸡。一年级课程简单，只有语文和数学。期末时，我数学全班第一，语文却差劲得多。那时的语文主要看字迹，作业本都是田字格，别人一格写一字，我却要用四个田字格才能写一个字——手控不住，写不下小字。正因如此，语文老师判定我不宜升级，我人生的第一次留级由此开始。 AI精修后（约3000字，保留全部事实，重构叙事节奏）八十年代末的豫西南，风里总裹着黄土与秸秆燃烧后的干燥气息。我出生在一个再普通不过的农村家庭，没有摇钱树，也没有锦鲤运。唯一能拿得出手的，是父辈同族里，我是第一个男丁。这个"第一"，落在爷爷眼里，是香火，是面子，更是他前半生未竟的执念。爷爷是村里仅有的两个识字超过《百家姓》的"知识分子"，在镇小学教了二十年数学。他的粉笔灰染白了袖口，他的戒尺敲碎了教室的黄昏。或许正因为这份职业习惯，从我牙牙学语起，他就把古诗当算术题教。我分不清平仄，背不出深浅，但他不纠正，只反复念：“床前明月光，疑是地上霜。“我跟着念，他点头。五岁那年，五十首古诗已经倒背如流。每次背完，他必会端着搪瓷缸子，站在村口的老槐树下，声音洪亮地复述一遍。那是一种朴素的炫耀，也是一种无声的托付。同学刘正欣家养着的那只冠红如血的芦花公鸡，仗着宅院开阔，见人就扑。起初是试探，后来是突袭。翅膀拍打的风声、爪子刮过裤管的刺痛、摔倒时膝盖磕在碎石上的闷响，构成了我童年最鲜活的"课间操”。连续几天哭着跑完三公里后，爷爷沉默地蹲在院门槛上，吧嗒着旱烟。抽完一锅，他磕了磕烟袋锅：“搬过来住。"……从此，每天清晨五点五十，爷爷准时推开门，蹲下身：“上来。“我没有犹豫。爷爷的脊背不算宽，却足够托起一个五岁男孩的全部重量。他背着我绕开刘正欣家的院墙，脚步稳得像踩过老牛背。风从耳边掠过，我趴在他肩上，看着路边沾露的狗尾草一晃一晃，忽然觉得，上学这件事，也没那么可怕。成绩的双轨制在此刻显影：数学卷面干净利落，语文本上却密密麻麻挤着失控的笔画。红笔圈出的"重写”，像是给小手判了刑。别人一格一字，我却要用四格才塞得下。字写得越大，老师判得越严。最终，那张写着"建议留级"的通知单，轻飘飘地落进抽屉。我人生的第一次留级，就这样被一张田字格裁定。模型到底"神"在何处？（4个核心能力拆解） AI没有替我"编造"故事，而是完成了叙事工程的重构。对比可见，它的核心能力体现在四个维度： 1. 时代氛围的"物理化嵌入” 原始：仅用"80年代末"“农村普遍贫穷"带过背景。 AI处理：将宏观年代压缩进微观场景（干风、秸秆味、搪瓷缸子、老槐树、蓝布书包）。传记写作的第一课：时代不是背景板，而是人物呼吸的物理环境。模型能精准调用符合时代的器物库，让读者"闻到"年代，而非"读到"年代。 2. 人物塑造的"动作替代定性” 原始：直接下结论"爷爷对我抱有很大期望……每次学会，爷爷都会开心地在人前炫耀。"（作者跳出来评价） AI处理：拆解为可拍摄的行为链：粉笔灰染袖口 → 戒尺敲黄昏 → 不纠正只跟读 → 端缸子站树下复述 → 揣在贴身处。传记最忌空泛赞美，性格必须藏在可拍摄的动作里，情感必须活在具体的器物中。当"期望"变成"站着复述的声音”，人物就立住了。 3. 事件描写的"五感沉浸"与"视角切换” 原始：“哭着、跑着、摔着赶到学校。"（高度概括的陈述） AI处理：补全触觉（爪子刮裤管、膝盖磕碎石）、听觉（扑腾风）、视觉（狗尾草晃动），并切换为"趴肩上看路边"的儿童视角。这不仅是画面增强，更是情感交付的仪式：世界虽有尖刺，但有人替我挡下。记忆不是被"讲"出来的，而是被"经历"出来的。 4. 叙事节奏的"钩子-展开-余韵"控制原始：信息密度均匀，段落平铺，缺乏情绪起伏。 AI处理：采用纪实文学标准节奏。每300-500字设置一个情绪微转折（教诗→公鸡→搬入→留级），结尾留白（“忽然觉得，上学这件事，也没那么可怕”），为后文的"留级年"埋下心理伏笔。模型天然具备网文/大众阅读的节奏感知力，能自动规避"流水账"陷阱。给文字创作者的3点实操建议如果你也在用AI辅助写作或整理口述史，不妨在下次动笔前，对照这份清单自我检视：写作陷阱破解策略检验标准贴标签（如"家里很穷"“爷爷很严”）用"物"载"情”：写他身边的器物、习惯动作、说话时的微表情能否让读者自己得出这个结论？平铺直叙（只写结果）补全五感：光线、气味、温度、声音、触感读这段时，脑内能否自动播放"小电影"？信息堆砌（事件挤在一起）控节奏：每章/每段设置"微钩子"（一个声音、一句对话、一个反常细节）是否每300字就有情绪或场景的微小起伏？视角单一（纯儿童视角或纯成年上帝视角）留白艺术：保留"家人后来告知"“记不清"等残缺感，成年视角仅用于关键处点题时间纵深感是否自然拉开，而非生硬说教？写在最后原始手稿约800字，精修后控制在3000字左右。这不是"注水”，而是**“塑形”**。记忆原本就是粗糙的石头，写作者的工作不是把它磨成光滑的玻璃球，而是找到它原本的纹理，用刀锋刻出呼吸的缝隙。客观地说，AI目前仍无法替代亲历者的情感内核与独特生命经验。它的真正价值在于：提供结构框架、补全感官维度、控制叙事节奏、规避表达陷阱。它能当好一把"刻刀"，但握刀的手，必须永远是你自己。如果你也在整理家族记忆，或尝试将生活经历转化为可读故事，不妨挑一段"流水账"，交给模型做一次"叙事重构"。把"他对我很好"改成"他每天清晨把热豆浆推到我手边，杯底还留着他的指纹"；把"那年很难"改成"粮票换不来一斤红薯，煤油灯的火苗被风压得只剩豆粒大小"。好传记不怕慢，只怕没有心跳。愿你的每一段旧时光，都能在今日的纸页上重新生根。注：本文所涉前后对比文本均基于真实手稿与AI辅助精修版，未添加虚构情节。AI写作辅助的本质是"结构优化+细节显影"，核心叙事权与情感归属始终在写作者手中。

AI 大模型最新进展盘点

前言人工智能领域在近两年迎来了爆发式增长，大语言模型（LLM）技术日新月异。本文将盘点当前 AI 大模型的最新进展与趋势。多模态能力突破现代大模型已经不再局限于文本处理，而是朝着多模态方向快速发展：视觉理解：GPT-4V、Gemini 等模型能够理解图片内容并进行分析视频生成：Sora 等模型可以根据文本描述生成高质量视频音频处理：语音识别、合成和实时翻译能力不断提升开源生态繁荣开源大模型社区蓬勃发展，涌现出众多优秀的开源项目： Llama 系列：Meta 开源的 Llama 模型不断迭代，性能逼近闭源模型 Qwen 系列：阿里巴巴通义千问在中文理解方面表现优异 DeepSeek：深度求索推出的模型在数学和编程领域表现突出 Agent 与工具调用大模型正在从单纯的对话工具演变为能够自主完成复杂任务的智能体：函数调用（Function Calling）让模型能调用外部 API RAG（检索增强生成）技术让模型能利用实时信息多 Agent 协作完成复杂的工作流程未来展望 AI 大模型技术仍在快速演进中，我们期待看到更强大的推理能力、更低的使用成本、以及更广泛的应用场景。保持学习，拥抱变化！