MindWave AI快报 聚合 AI 前沿动态,筛出值得关注的信号。

Perplexity推端云混合推理 七月登陆Intel与RTX设备

Perplexity宣布为桌面智能体Perplexity Computer引入端云混合推理架构,预计2026年7月在Intel与英伟达RTX Spark硬件上启用,本地处理隐私敏感任务,云端承担复杂推理。

References

Perplexity推出端云混合推理 本地隐私处理成核心卖点

AI搜索公司Perplexity近日宣布,将为桌面智能体环境Perplexity Computer引入端云混合推理架构。该系统能够自动识别任务类型与隐私敏感度,将计算分流至本地设备或云端大模型,预计2026年7月率先登陆Intel与英伟达RTX Spark硬件平台。

隐私数据不离设备

混合推理将隐私扫描、个人身份信息过滤等任务交由本地模型处理,确保敏感数据不离开用户设备。在官方演示视频中,本地子智能体检测到敏感文件后会主动拦截,仅将脱敏后的指令发送给云端处理。这种设计解决了企业用户对AI应用中数据安全的核心顾虑。

Intel Core Ultra Series 3提供180 TOPS算力

这一合作的技术基础来自Intel在CES 2026期间发布的Core Ultra系列3处理器。该芯片整合CPU、GPU与NPU,可提供高达180 TOPS的总体算力,配合OpenVINO工具套件与最高96GB内存支援,使个人设备得以本地运行高达700亿参数(70B)的大型语言模型,上下文长度支持达32K。Intel资深副总裁Jim Johnson表示:「更大的上下文对本地端更复杂、更深层的LLM应用至关重要。」

成本与数据主权双重考量

Perplexity CEO Aravind Srinivas在CES演讲中阐述了本地化运算的四大理由:效能、隐私、经济与控制权。他指出:「AI的每一笔查询都在消耗真实金钱,这与软件完全不同。」通过本地运行低成本任务,仅在必要时调用云端推理,企业可大幅降低带宽与基础设施成本,同时确保企业情报完全保留在自有设备上。

Perplexity表示,新架构将决策范围从选择模型延伸至确定计算位置,计划整合本地与云端算力,实现成本优化与数据主权的双重目标。