AI行业资讯快讯

每日AI快讯

本月 2024年

2024-12-30 星期一 AI快讯

1. 讯飞医疗科技股份有限公司在香港联交所主板成功上市，标志医疗大模型领域的首个上市公司。致力于提升基层医疗、医院服务和智慧影像等领域。

2. 支付宝新功能「探一下」发布，提供AI视觉搜索，满足用户好奇心，功能包括知识、灵感和文本探索。

3. 智元机器人开源AgiBot World数据集，涵盖真实场景下的百万级数据，覆盖家居、餐饮等多个核心场景，提供80种技能视频。

4. PixVerse V3.5上线，新版本提升动漫生成效果，新增首尾帧功能，支持10秒极速视频生成。

5. 拓元智慧完成近亿元融资，资金将用于发展多模态大模型和具身智能技术，累计营收近亿元，已应用于无人零售和文教创作领域。

2024-12-26 星期四 AI快讯

1. DeepSeek V3发布：深度求索推出新版AI模型DeepSeek V3，超越Claude 3.5 Sonnet，编程能力大幅提升，成功率从17%增至48%，支持代码编写和Bug修复，现已开源。
开源网站：https://huggingface.co/deepseek-ai/DeepSeek-V3-Base/tree/main

2. 阶跃星辰升级：Step-1X-Medium图像生成模型更新，提升30%性能，支持“图生图”、风格迁移和局部修改，增强“中国风”内容创作能力。

3. 腾讯DRT-01模型：腾讯推出DRT-01系列AI模型，提升文学翻译质量，特别是在比喻和隐喻的理解上，采用多智能体框架优化翻译效果，超越其他模型。

4. 通义发布新功能：阿里巴巴通义模型新增功能，提升多语言处理和对话能力，扩展到更多行业应用。

2024-12-25 星期三 AI快讯

1.OpenAI宣布ChatGPT与Mac应用深度集成，特别是在编程和写作领域。用户现可在Warp、Xcode等应用中简易操作ChatGPT，同时支持Notion、Apple Notes等多应用协作。

2. Qwen团队发布了开源多模态推理模型QVQ，旨在提升AI的视觉理解和问题解决能力。在MMMU评测中，QVQ得分70.3，表现优于Qwen2-VL-72B-Instruct。

3. IBM推出Granite 3.1模型，增强了处理复杂文本的能力，支持多达128,000个令牌。该模型在保持RAG责任和信任标准的同时，将继续更新，2025年第一季度预计加入多模式功能。

4. 快手可灵1.6版带来文本响应度、画面美感及运动合理性的显着提升，特别在物理反馈和人物表现上有明显进步。

2024-12-24 星期二 AI快讯

1. OpenAI发布o3模型，标志着接近AGI的重大步骤，o3在多个AGI级测试中表现优异，超越前代模型，mini版预计1月底推出。

2. AI独角兽阶跃星辰完成数亿美元B轮融资，由上海国资和腾讯领投，资金主要用于深化研发和拓展商业应用。

3. 小红书推出新AI搜索产品“点点”，针对生活服务场景，能够整合全网信息并提供视频回复，旨在提升用户体验。

4. 马斯克的xAI完成60亿美元融资，主要由A16Z和Blackrock投资，资金将支持新基础设施建设和创新产品开发。

2024-12-20 星期五 AI快讯

1. 谷歌发布Gemini 2.0 Flash Thinking推理模型：这一通用推理模型在数学、代码、指令跟随等多个领域表现卓越，思考速度比其他模型快5倍。支持32k上下文窗口并不联网，未来将支持更多工具。现已在谷歌AI Studio免费提供试用。

2. AI编程助手Cursor获得1亿美元融资，估值升至26亿美元：AI编程助手Cursor的背后公司Anysphere完成B轮融资，收入快速增长。新发布的Cursor 0.44版本带来了代理性能改进和Yolo模式，提升了用户体验和代码变更审查效率。

3. ElevenLabs推出Flash语音对话模型：Flash是全球最快的文本转语音模型，延迟仅75毫秒，特别适合低延迟对话式语音助手。支持32种语言，提供高质量语音合成，尽管在情感深度上稍逊，但在速度上表现出色。

4. 快手可灵1.6模型发布：可灵1.6版本实现了图生视频的大幅提升，特别是在物理真实感、人物运动表现和语义理解上。新版本在动作物理反馈、人物表情和动作细节上更加自然丰富，文本响应度和画面质量均有所提升。