以下是使用deepseek v2 chat 对教材
<Map: Chemistry - The Molecular Nature of Matter and Change (Silberberg)>的1.1部分进行翻译后简单标注类型标签制作的CSV数据集
input,output,type
"化学家研究什么?","化学家研究物质材料的结构、物理性质和化学性质。","定义"
"哪些是物质?","黄金、铱、花生、人、邮票、烟雾、烟尘和笑气都是物质。","列举"
"哪些不是物质?","能量、光、声音、思想和情感不是物质。","列举"
"质量和重量的区别是什么?","质量是物体的一个基本属性,不依赖于其位置,而重量是由于作用在物体上的引力吸引所产生的力,取决于物体的位置。","解释"
可以看出质量相对较高,如果开发api自动脚本能极大的提高效率(至于到时候要付多少api费用就不知道了)
目前采集数据的困难就是中文资料资源较少,转化成本高(很多都是扫描版)英文资料恰好相反,但是粗翻译和精翻译又是额外的开销
时段 | 个数 |
---|---|
{{f.startingTime}}点 - {{f.endTime}}点 | {{f.fileCount}} |