Google 从 AWS 和微软挖走两名云计算高管
Google 从竞争对手亚马逊 AWS 和微软挖走了两名云计算高管,以加强其人工智能团队建设。这一举动透露出 Google 在云计算和人工智能领域的焦虑。
OpenAI 推出大学专用 ChatGPT
OpenAI 发布了基于 GPT-4 构建的 ChatGPT Edu,专为大学设计。该版本能够处理文本和图像,并使用数据分析等高级工具,支持超过 50 种语言,提供更高质量的回答和速度。用户可以创建和定制自己的 GPT 模型,并在大学工作区内共享。
Claude 集成外部工具和 API
Anthropic 宣布其 AI 模型 Claude 现已支持集成外部工具和 API ,进一步提升智能应用的便捷性和功能性。新功能包括流式传输、强制工具使用和图像输入处理,旨在减少等待时间、实现实时响应并增强对话自然性。该功能已在 Anthropic Messages API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 上线。
LLM360 团队推出全新开源模型 Amber 和 Crystal
LLM360 团队在开源 LLM 社区中取得了重要进展,成功开发了 Amber 和 Crystal 模型,并进一步扩展至 K2 。这些开源模型由 m-a-p 团队贡献,旨在推动 LLM 的民主化和真正的开放科学。相关论文详细介绍了数据整理、基础架构细节、中间检查点和扩展法则。
Puppeteer 以层次化世界模型实现类人控制
Nicklas Hansen 与团队成员共同发布了一项名为 Puppeteer 的新方法。该方法通过层次化世界模型,学习高维度的类人控制策略,使得动作看起来更加自然。
CraftsMan 3D 建模可自动全局优化和交互精细化
CraftsMan 是一种新型生成性 3D 建模系统,能够在几秒钟内生成高保真 3D 模型。该系统采用多视图扩散模型生成粗糙几何体的多个视图,并通过 MV 条件的 3D 扩散模型生成最终 3D 模型,提高了通用性。此外,CraftsMan 还提供精细化工具,包括自动全局精细化和交互式魔法笔刷,使 3D 建模更加高效和可控。系统支持通过文本提示或参考图像生成 3D 模型。
港科大团队推出 Era3D 模型 单图可生成多视角 3D 视图
港科大和港大研究团队推出了新的 3D 生成模型 Era3D ,只需一张图像即可创建多视角3D视图。与现有技术相比, Era3D 能够以高达 512×512 分辨率生成高质量的多视图图像,同时将计算复杂度降低 12 倍。该模型采用基于扩散的相机预测模块来估计输入图像的焦距和仰角,以避免形状失真,并加强多视图扩散中的对极先验,从而促进有效的跨视图信息融合。
清华施路平团队研发类脑视觉芯片登上 Nature 封面
清华大学类脑计算研究中心施路平团队研发的“天眸芯”登上了最新一期的 Nature 封面。这款全球首款类脑互补视觉芯片实现了基于视觉原语的互补双通路类脑视觉感知新范式,模仿了人类视觉系统特征。性能方面,“天眸芯”能够以每秒 10,000 帧的高速、 10bit 的高精度和 130dB 的高动态范围进行视觉信息采集,并大幅减少带宽需求。将其集成到自动驾驶系统中,即使面对突然闪光干扰、隧道等高动态范围场景和异常物体移动等复杂情况,系统也能实现精准认知和快速响应。
星环科技发布 AI 基础设施产品 TKH
星环科技正式发布其最新 AI 基础设施产品 Transwarp Knowledge Hub( TKH )。该平台旨在为企业提供从 AI 基础设施建设到大数据和 AI 研发应用的完整解决方案。TKH 集成了语料开发、模型训练、多模态知识工程、知识存储与服务、 AI 应用构建等功能,支持异构算力和数据资产的统一管理。
Soul 推 AI 陪伴
社交平台 Soul 近期在 AIGC+ 社交领域推出了多项功能,包括 AI 聊天助理、 AI 合唱和 AI 狼人杀等,并发布了沉浸式 AI 聊天陪伴应用“异世界回响”。根据 Soul 的报告,超过 10% 的年轻人已经通过 AIGC 赚取收入。
OpenAI 成功阻止五起利用 AI 操纵舆论和选举的隐秘行动
OpenAI 近日发布公告称,在过去三个月内成功阻止了 5 起企图利用其 AI 服务来操纵公众舆论和选举的隐秘行动。这些行动涉及俄罗斯、伊朗和以色列的多个组织和公司,试图在不暴露真实身份或意图的情况下影响政治结果。具体行动包括俄罗斯的“ Bad Grammar ”和“ Doppelganger ”,伊朗的“ International Union of Virtual Media ”,以及以色列的 STOIC 公司。