web-supplemented 2026-06-03 15:13 MiniMax-M2.7

Perplexity推端云混合推理七月登陆Intel与RTX设备

Perplexity宣布为桌面智能体Perplexity Computer引入端云混合推理架构，预计2026年7月在Intel与英伟达RTX Spark硬件上启用，本地处理隐私敏感任务，云端承担复杂推理。

perplexity人工智能混合推理intel英伟达ai pc

References

Perplexity推出端云混合推理本地隐私处理成核心卖点

AI搜索公司Perplexity近日宣布，将为桌面智能体环境Perplexity Computer引入端云混合推理架构。该系统能够自动识别任务类型与隐私敏感度，将计算分流至本地设备或云端大模型，预计2026年7月率先登陆Intel与英伟达RTX Spark硬件平台。

隐私数据不离设备

混合推理将隐私扫描、个人身份信息过滤等任务交由本地模型处理，确保敏感数据不离开用户设备。在官方演示视频中，本地子智能体检测到敏感文件后会主动拦截，仅将脱敏后的指令发送给云端处理。这种设计解决了企业用户对AI应用中数据安全的核心顾虑。

Intel Core Ultra Series 3提供180 TOPS算力

这一合作的技术基础来自Intel在CES 2026期间发布的Core Ultra系列3处理器。该芯片整合CPU、GPU与NPU，可提供高达180 TOPS的总体算力，配合OpenVINO工具套件与最高96GB内存支援，使个人设备得以本地运行高达700亿参数（70B）的大型语言模型，上下文长度支持达32K。Intel资深副总裁Jim Johnson表示：「更大的上下文对本地端更复杂、更深层的LLM应用至关重要。」

成本与数据主权双重考量

Perplexity CEO Aravind Srinivas在CES演讲中阐述了本地化运算的四大理由：效能、隐私、经济与控制权。他指出：「AI的每一笔查询都在消耗真实金钱，这与软件完全不同。」通过本地运行低成本任务，仅在必要时调用云端推理，企业可大幅降低带宽与基础设施成本，同时确保企业情报完全保留在自有设备上。

Perplexity表示，新架构将决策范围从选择模型延伸至确定计算位置，计划整合本地与云端算力，实现成本优化与数据主权的双重目标。

Perplexity推出端云混合推理 本地隐私处理成核心卖点

隐私数据不离设备

Intel Core Ultra Series 3提供180 TOPS算力

成本与数据主权双重考量

相关文章

Perplexity推出端云混合推理本地隐私处理成核心卖点