Mistral AI 推出最强文档识别模型 Mistral OCR:革新文档理解新标杆
人工智能公司 Mistral AI 今日宣布,其最新文档识别模型 Mistral OCR 正式上线。这一模型被誉为“地表最强 OCR”,以其卓越的性能和多功能性在 X 平台上引发热烈讨论。Mistral OCR 支持复杂 PDF、图像、表格...
Spark-TTS:用AI让声音“克隆”和“定制”成为现实!
在科技飞速发展的今天,人工智能已经渗透到我们生活的方方面面,从智能语音助手到各种自动化服务,AI正在以一种前所未有的方式改变我们的生活。今天,我要给大家介绍一项超级酷炫的技术——Spark-TTS,一个基于Qwen2.5模型的高效文本转语音...
三小时复刻Manus!OpenManus横空出世,斩获GitHub 3000+星标
Manus的出现间接引发了开源界复刻竞赛,除了AIbase分享的CAMEL-AI0天复刻Manus通用智能体OWL以外,一个名为OpenManus的项目仅仅凭借三小时的代码量,也实现了Manus复刻。就在昨天晚上,这个无需任何邀请即可使用的...
思科成立开源组织 AGNTCY,助力 AI 代理基础设施建设
近日,思科公司宣布成立一个新的开源组织 ——AGNTCY。该组织的目标是为 AI 代理的构建和协同工作提供关键基础设施。思科希望通过这一组织,能够集结 AI 和基础设施领域的专业人士,共同推动开放、可互操作的代理互联网的发展。图源备注:图片...
QQ音乐推出"AI音乐播客"创新功能:可以边听边懂边互动
QQ音乐近日推出了首创性的"AI音乐播客"技术功能,这一突破性技术将人工智能技术与播客形式深度融入音乐场景,通过Deepseek以及自研的琴语TTS大模型、文曲大模型等领先AI技术与多模态内容整合,为用户创造"边听歌边解读"的沉浸式体验,以...
美国计划用AI来识别支持哈马斯的外国学生并撤销签证
据路透社报道,有消息称美国国务院计划利用人工智能技术来撤销那些被视为支持哈马斯的外国学生签证。这一消息引发了人权倡导者和言论自由支持者的广泛关注和忧虑。根据 Axios 的报道,这项名为 “捕捉与撤销” 的计划将利用 AI 对数以万计的学生...
无需训练!Q-Filters 实现 KV 缓存高效压缩,提升推理性能
近年来,基于 Transformer 架构的大型语言模型(LLMs)取得了显著进展,诸如 Gemini-Pro1.5、Claude-3、GPT-4和 Llama-3.1等新模型能够处理成百上千的token。然而,这些扩展的上下文长度带来了实...
Docker 创始人发布 Dagger,力图开源替代 Claude Code!
Docker 的创始人所罗门・海克斯(Solomon Hykes)在社交媒体平台 X 上宣布,他可能开发出了一个开源的替代工具,以对抗 Anthropic 推出的 Claude Code。这个新工具是 Dagger 的组成部分,Dagger...
腾讯AI智能工作台ima知识库更新:上线「知识库广场」 支持共享
3月7日,腾讯旗下的AI智能工作台ima宣布上线「知识库广场」功能,为用户提供了一个集中发现和分享知识库的新平台。自ima共享知识库上线以来,用户已经开始利用这一工具创建和分享各类专业知识库,例如律师创建的AI法律知识库、教师创建的班级知识...
新开普:星普大模型表现出色,算力消耗显著降低
在最近的一次机构电话交流会上,新开普公司透露了其自研的星普大模型的最新测评结果。该模型采用了 SFT(监督微调)与 RL(强化学习 的训练技术,在智能推理效果上与 DeepSeek-R1相近,且算力消耗仅为 DeepSeek-R1的1/20...