2024年智源FlagEval全球评测榜单出炉:全球百模争霸,国产大模型拿下多个冠军
2024年12月19日,智源研究院发布了国内外100余个开源和商业闭源模型的评测结果,涵盖语言、视觉语言、文生图、文生视频、语音语言等领域的综合及专项评测。与5月的评估相比,智源评测在任务解决能力上进行了扩展和细化,新增了数据处理、高级编程和工具调用等能力与任务。首次增加了针对金融量化交易场景的应用能力评估,以及基于模型辩论的对比评估方式,深入分析模型的逻辑推理、观点理解和语言表达等核心能力。 智源评测显示,2024年下半年大模型发展更注重综合能力提升与实际应用。多模态模型发展迅速,出现了新的厂商与模型
AI创业,不敲一行代码
第一步:梳理业务逻辑。 第二步:拖拽式设计 UI。 第三步:选平台和形式,发布。 一个科研写作助手的 AI 应用就搞定了。 再例如开发一个小程序,也只需要拖拖拽拽即可。 扣子 1.5 可以通过这种拖拽的方法,直接发布为小程序(抖音、微信)、H5、API等多种的应用形态。 开发一个 AI 应用,就变成有想法就可以的事情;更是让《人人都是产品经理》走进现实。 手把手开发一个 AI 应用 1、创建应用 进入扣子的主页之后,点击左侧菜单栏中的“+”。 点击“创建应用”之后,就能看到各式各样、适合不同场景的应用模
OpenAI 连续 12 日圣诞发布完整回顾
Day1:发布 o1 满血版、ChatGPT Pro 最贵订阅版本 200 美元/月。 Day2:发布强化微调新功能,用少量训练数据即可在特定领域构建专家模型。 Day3:发布视频生成模型 Sora。 Day4:Canvas 全面开放,升级代码功能。 Day5:展示 OpenAI 与苹果智能合作功能。 Day6:发布高级实时视频理解功能。 Day7:发布 Projects In ChatGPT 功能。 Day8:搜索功能全面开放,支持语音搜索。 Day9:o1 API 开放,实时 API 更新。 Day