<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>Exo on 因特吧</title><link>https://zz3656.github.io/hugo-blog/tags/exo/</link><description>Recent content in Exo on 因特吧</description><image><title>因特吧</title><url>https://zz3656.github.io/hugo-blog/logo.png</url><link>https://zz3656.github.io/hugo-blog/logo.png</link></image><generator>Hugo</generator><language>zh_CN</language><lastBuildDate>Sun, 03 May 2026 05:35:00 +0800</lastBuildDate><atom:link href="https://zz3656.github.io/hugo-blog/tags/exo/index.xml" rel="self" type="application/rss+xml"/><item><title>exo：将多台设备组成AI推理集群的完整指南</title><link>https://zz3656.github.io/hugo-blog/posts/exo-%E5%B0%86%E5%A4%9A%E5%8F%B0%E8%AE%BE%E5%A4%87%E7%BB%84%E6%88%90ai%E6%8E%A8%E7%90%86%E9%9B%86%E7%BE%A4%E7%9A%84%E5%AE%8C%E6%95%B4%E6%8C%87%E5%8D%97/</link><pubDate>Sun, 03 May 2026 05:35:00 +0800</pubDate><guid>https://zz3656.github.io/hugo-blog/posts/exo-%E5%B0%86%E5%A4%9A%E5%8F%B0%E8%AE%BE%E5%A4%87%E7%BB%84%E6%88%90ai%E6%8E%A8%E7%90%86%E9%9B%86%E7%BE%A4%E7%9A%84%E5%AE%8C%E6%95%B4%E6%8C%87%E5%8D%97/</guid><description>&lt;h2 id="什么是-exo"&gt;什么是 exo？&lt;/h2&gt;
&lt;p&gt;exo 是一个由 &lt;a href="https://x.com/exolabs"&gt;exo labs&lt;/a&gt; 维护的开源项目（Apache 2.0 协议），它的核心理念非常简单但强大：&lt;strong&gt;把你所有的设备连接起来，组成一个统一的 AI 推理集群&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;不管你手上有 MacBook、Linux 服务器、还是其他设备，只要装上 exo，它们就能自动发现彼此，协同运行大语言模型。这意味着你可以运行单个设备放不下的大模型——比如用 4 台 Mac Studio 跑 671B 参数的 DeepSeek v3.1。&lt;/p&gt;
&lt;p&gt;项目地址：&lt;a href="https://github.com/exo-explore/exo"&gt;https://github.com/exo-explore/exo&lt;/a&gt;&lt;/p&gt;
&lt;h2 id="核心特性"&gt;核心特性&lt;/h2&gt;
&lt;h3 id="1-自动设备发现"&gt;1. 自动设备发现&lt;/h3&gt;
&lt;p&gt;运行 exo 的设备会自动在局域网内发现彼此，无需任何手动配置。你不需要写配置文件，不需要指定 IP 地址，启动就能用。&lt;/p&gt;
&lt;h3 id="2-thunderbolt-rdma-支持"&gt;2. Thunderbolt RDMA 支持&lt;/h3&gt;
&lt;p&gt;exo 是首个支持 Thunderbolt 5 RDMA（远程直接内存访问）的 AI 推理框架。通过 Thunderbolt 5 连接设备，可以将设备间延迟降低 99%。这意味着添加更多设备不仅增加了显存，还真正加快了推理速度。&lt;/p&gt;
&lt;h3 id="3-拓扑感知的自动并行"&gt;3. 拓扑感知的自动并行&lt;/h3&gt;
&lt;p&gt;exo 会实时分析你的设备拓扑——每台设备的算力、内存，以及设备间的网络延迟和带宽——然后自动决定如何最优地拆分模型。你不需要手动配置流水线并行还是张量并行，exo 帮你搞定。&lt;/p&gt;
&lt;h3 id="4-张量并行tensor-parallelism"&gt;4. 张量并行（Tensor Parallelism）&lt;/h3&gt;
&lt;p&gt;支持将模型张量切分到多台设备上并行计算。实测效果：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;2 台设备：最高 1.8 倍加速&lt;/li&gt;
&lt;li&gt;4 台设备：最高 3.2 倍加速&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id="5-多种-api-兼容"&gt;5. 多种 API 兼容&lt;/h3&gt;
&lt;p&gt;exo 同时兼容以下 API 格式，可以直接对接你现有的工具：&lt;/p&gt;</description></item></channel></rss>