什么是开源人工智能?
开源人工智能是人工智能软件和工具,其源代码开放并向公众开放。开发人员、研究人员和其他感兴趣的各方可以访问、使用、修改和分发该软件,而无需触发任何许可条件。
然而,随着技术的不断发展和变得更加复杂,一个相当重要的问题浮出水面:支撑人工智能的核心原理、算法和数据集是否应该是专有的?或者它们应该属于人类的集体知识?下面,我们就来探究一番。
人工智能技术应该开源,其原因有三个。
开源人工智能可以减少偏见
彻底消除人工智能偏见是一个极其困难的问题。然而,开源人工智能提供了多种有助于解决和减少偏见的机制,包括透明度、审计和社区参与。
透明度
在这种情况下,透明度意味着将人工智能模型开源并公开可用,以便研究人员和开发人员可以检查底层代码。这使得识别训练数据或设计结构本身中潜在的偏差来源变得更加容易。
与此形成鲜明对比的是,一家大企业运行的闭源人工智能以做出种族主义推论、制造错误信息,甚至指责其创造者剥削用户,用终结者式的人工智能反其创造者的故事来吓唬一些不懂行的用户。透明度将有助于缓解所有这些问题,避免给最终用户带来不便和冒犯。
审计
使人工智能开源意味着它也可以向外部各方开放来审计系统,而无需特殊的访问权限、许可或保密协议,就像闭源人工智能一样。这将迫使创建者在创建系统时更加负责,并进一步确保偏见被捕获和纠正。
社区参与
开源代码通常涉及来自不同背景的广泛贡献者。多元化的贡献者群体可以带来不同的观点,这反过来可能有助于识别和解决偏见,这些偏见可能被一个更同质的群体所忽视,而这些群体可能正遭受着狭隘的视野。
开源人工智能可以推动科学进步
人工智能的发展极大地改变了我们进行科学研究的方式。尤其是开源人工智能,为研究人员提供了丰富的知识和工具库。Google的TensorFlow和Meta的PyTorch等平台促进协作、加速进展并提高人工智能模型的质量。
如果这些研究人员没有得到适当的资助,并且人工智能都是闭源的,那么这些论文和出版物都是不可能的。
开源人工智能可以创建新标准
开源人工智能可用于影响和创建新标准。人工智能的兴起引发了有关偏见、公平和透明度等道德考虑的讨论。由于其公共性质,开源人工智能项目经常引领这些讨论,影响负责任的人工智能的标准。
然而,除了企业员工之间的内部竞争之外,闭源人工智能项目不会促进创新。最终结果是产品可能不具有道德责任感,无法促进围绕其性能或设计的讨论。
此外,从工程角度来看,如果没有开源人工智能,再现性和性能基准也会受到影响。可重复性在人工智能研究中极其重要,开源人工智能项目通常倡导严格的文档、标准化测试环境和共享数据集,以确保其他人可以重现结果,从而导致行业中文档和可重复性的更高标准。还需要标准化基准,以比较所有这些模型的性能。