【2025年1月21日 星期二】
字节跳动发布AI中文IDE“Trae”
字节跳动推出面向专业开发者的AI Coding产品“Trae”,支持AI问答、代码自动补全和基于Agent的AI编程等功能,可实现端到端开发,内置GPT-4o和Claude-3.5-Sonnet模型供免费使用。该产品目前仅支持Mac版本,Windows版本即将上线,旨在帮助开发者提高编程效率。
来源:IT之家
研究发现GPT-4 Turbo回答高级历史题准确率仅46%
奥地利复杂科学研究所研究发现,GPT-4 Turbo等大型语言模型在回答高级历史问题时准确率仅为46%,表现不如随机猜测。研究指出,这些模型在处理冷门历史知识时存在短板,训练数据可能存在偏见,但其在历史研究中的辅助潜力仍被看好。
来源:IT之家
微软开源Markdown工具MarkItDown,支持多模态LLM
微软开源了一款名为MarkItDown的文件格式转换工具,支持将Office文档、PDF、图像、音频等多种格式转换为Markdown格式,并可集成多模态LLM,直接输出商业报告等复杂文档。该工具发布两个月内GitHub收藏数超过3万,显著提升了开发者处理多模态数据的效率。
来源:量子位
浙大与阿里达摩院构建多模态教科书语料库
浙江大学和阿里巴巴达摩院联合提出一种基于教学视频的多模态知识语料库,从超过2.5年的教学视频中提取图文交织的教科书内容,涵盖数学、物理、化学等多个学科。该语料库通过高质量的知识语料提升多模态大模型(VLMs)的预训练效果,在多个基准测试中表现出色,相关研究已登上Hugging Face数据集趋势榜单。
来源:机器之心
英伟达副总裁:人形机器人发展周期缩至5年
英伟达副总裁Deepu Talla表示,人形机器人将迎来快速发展,预计5年内实现显著突破。英伟达通过“三台计算机”——训练用的GPU、仿真用的Omniverse以及部署用的Jetson或AGX系统——加速机器人开发流程,将原本需要50年的发展周期缩短至5年。该方案通过仿真技术解决机器人开发中的数据稀缺问题,推动人形机器人量产。
来源:量子位