2024-12-30 星期一 AI快讯
1. 讯飞医疗科技股份有限公司在香港联交所主板成功上市,标志医疗大模型领域的首个上市公司。致力于提升基层医疗、医院服务和智慧影像等领域。
2. 支付宝新功能「探一下」发布,提供AI视觉搜索,满足用户好奇心,功能包括知识、灵感和文本探索。
3. 智元机器人开源AgiBot World数据集,涵盖真实场景下的百万级数据,覆盖家居、餐饮等多个核心场景,提供80种技能视频。
4. PixVerse V3.5上线,新版本提升动漫生成效果,新增首尾帧功能,支持10秒极速视频生成。
5. 拓元智慧完成近亿元融资,资金将用于发展多模态大模型和具身智能技术,累计营收近亿元,已应用于无人零售和文教创作领域。
2024-12-26 星期四 AI快讯
1. DeepSeek V3发布:深度求索推出新版AI模型DeepSeek V3,超越Claude 3.5 Sonnet,编程能力大幅提升,成功率从17%增至48%,支持代码编写和Bug修复,现已开源。
开源网站:https://huggingface.co/deepseek-ai/DeepSeek-V3-Base/tree/main
2. 阶跃星辰升级:Step-1X-Medium图像生成模型更新,提升30%性能,支持“图生图”、风格迁移和局部修改,增强“中国风”内容创作能力。
3. 腾讯DRT-01模型:腾讯推出DRT-01系列AI模型,提升文学翻译质量,特别是在比喻和隐喻的理解上,采用多智能体框架优化翻译效果,超越其他模型。
4. 通义发布新功能:阿里巴巴通义模型新增功能,提升多语言处理和对话能力,扩展到更多行业应用。
2024-12-25 星期三 AI快讯
1.OpenAI宣布ChatGPT与Mac应用深度集成,特别是在编程和写作领域。用户现可在Warp、Xcode等应用中简易操作ChatGPT,同时支持Notion、Apple Notes等多应用协作。
2. Qwen团队发布了开源多模态推理模型QVQ,旨在提升AI的视觉理解和问题解决能力。在MMMU评测中,QVQ得分70.3,表现优于Qwen2-VL-72B-Instruct。
3. IBM推出Granite 3.1模型,增强了处理复杂文本的能力,支持多达128,000个令牌。该模型在保持RAG责任和信任标准的同时,将继续更新,2025年第一季度预计加入多模式功能。
4. 快手可灵1.6版带来文本响应度、画面美感及运动合理性的显着提升,特别在物理反馈和人物表现上有明显进步。
2024-12-24 星期二 AI快讯
1. OpenAI发布o3模型,标志着接近AGI的重大步骤,o3在多个AGI级测试中表现优异,超越前代模型,mini版预计1月底推出。
2. AI独角兽阶跃星辰完成数亿美元B轮融资,由上海国资和腾讯领投,资金主要用于深化研发和拓展商业应用。
3. 小红书推出新AI搜索产品“点点”,针对生活服务场景,能够整合全网信息并提供视频回复,旨在提升用户体验。
4. 马斯克的xAI完成60亿美元融资,主要由A16Z和Blackrock投资,资金将支持新基础设施建设和创新产品开发。
2024-12-20 星期五 AI快讯
1. 谷歌发布Gemini 2.0 Flash Thinking推理模型:这一通用推理模型在数学、代码、指令跟随等多个领域表现卓越,思考速度比其他模型快5倍。支持32k上下文窗口并不联网,未来将支持更多工具。现已在谷歌AI Studio免费提供试用。
2. AI编程助手Cursor获得1亿美元融资,估值升至26亿美元:AI编程助手Cursor的背后公司Anysphere完成B轮融资,收入快速增长。新发布的Cursor 0.44版本带来了代理性能改进和Yolo模式,提升了用户体验和代码变更审查效率。
3. ElevenLabs推出Flash语音对话模型:Flash是全球最快的文本转语音模型,延迟仅75毫秒,特别适合低延迟对话式语音助手。支持32种语言,提供高质量语音合成,尽管在情感深度上稍逊,但在速度上表现出色。
4. 快手可灵1.6模型发布:可灵1.6版本实现了图生视频的大幅提升,特别是在物理真实感、人物运动表现和语义理解上。新版本在动作物理反馈、人物表情和动作细节上更加自然丰富,文本响应度和画面质量均有所提升。