Etched 公司最近发布了一款AI芯片服务器,基于自研的 Sohu 芯片,每秒能生成超过 50 万个 tokens。该产品由 Gavin Uberti 和 Chris Zhu 与多位前英特尔和赛普拉斯半导体的高管共同创立的 Etched 公司推出。
Sohu 芯片专为 Transformer 模型设计,尽管它不能运行其他AI模型,但在性能上有显著优势。Etched 公司解释,随着摩尔定律的逐渐失效,专用化已经成为提升性能的出路。
这次产品发布伴随着新一轮融资,Primary Venture Partners和Positive Sum Ventures 领投,支持者包括Peter Thiel、Stanley Druckenmiller 和 Kyle Vogt。
Sohu芯片采用了台积电的4纳米工艺制造,通过优化硬件和软件管道,去掉了不必要的组件,从而提高了效率并减少了能耗。与传统的通用 GPU 不同,Sohu 芯片虽然无法运行卷积神经网络(CNN)、长短期记忆网络(LSTM)或状态空间模型(SSM),但在 Transformer 模型上的表现优异。
在推理性能方面,Sohu 芯片表现出色,同时能耗也更低。Etched 的 CEO Gavin Uberti 指出,Sohu 在运行文本、图像和视频 Transformer 模型时,比 NVIDIA 的下一代 Blackwell GB200 GPU 快一个数量级,且成本更低。
Etched 公司由 Gavin Uberti 和 Chris Zhu 在2022年创立,专注于开发专用芯片,特别是应对 Transformer 模型的需求。公司的团队包括多位前英特尔和赛普拉斯半导体的高管。
Etched 公司最近完成了一轮1.2亿美元的融资,由 Primary Venture Partners 和 Positive Sum Ventures 领投,Peter Thiel、Stanley Druckenmiller 和 Kyle Vogt 也参与了投资。这笔资金将用于进一步开发和推广Sohu 芯片。
Sohu 芯片在性能上远超现有的通用 GPU,特别是在处理 Transformer 模型时,它的效率和成本优势显著。