数据集 标签,匹配到约3个结果, 耗时0.0558秒

哈佛大学开源 AI 训练数据集“Institutional Books 1.0”,涵盖馆藏 98.3 万本图书

哈佛大学法学院图书馆开源首个AI训练数据集“Institutional Books 1.0”,涵盖98.3万本图书、2420亿Token,支持245种语言。40%为英语,60%为其他语言,书籍主要来自19-20世纪。未来还将加入数百万份历史...
2025-06-17
·
浏览35次

Yandex 发布最大音乐推荐开源数据集 Yambda

俄罗斯搜索巨头Yandex发布全球最大音乐推荐开源数据集Yambda,含47.9亿条匿名用户交互数据,覆盖939万首歌曲,助力开发者打造智能音乐服务。数据集分三种规模,最大需85GB存储空间。#音乐科技# #AI推荐#...
2025-05-30
·
浏览91次

全球最大甲骨文“数据集”开源

“数字甲骨共创中心”今日正式开源全球最大的甲骨文多模态数据集,共包含一万片甲骨的拓片、摹本,甲骨单字对应位置、对应字头、对应释文以及辞例分组、释读顺序等数据。...
2024-07-06
·
浏览488次
上一页
·
下一页
· 当前第1页