理解大数据的唯一方法是将其缩减为更小的、具有视觉吸引力的对象,这些对象代表大数据集的各个方面。例如,通过传感器收集气象数据,并通过计算机处理全国各地的天气报告大量数据,并将其转换为图表或图形形式的小数据,然而通过电视新闻播放,人们通过这种形式很容易了解天气状况。
小数据如何有效?
对于人工智能的理解,数据起着重要的作用。训练人工智能需要大量数据。这种认为人工智能需要大量数据才能运行的假设忽略了存在性,并掩盖了不需要大数据进行训练的潜在方法。
小数据包括迁移学习、数据标记、人工数据、贝叶斯方法以及强化学习。使用小数据的方法也可以吸引非技术专业人士了解数据何时、何地以及如何对人工智能有用。通过评估人工智能领域当前和未来的进展,小数据方法正在科学研究领域取得更多进展。
机器学习并不局限于大数据,还有广泛使用的小数据方法。美国和中国在小数据方法方面的研究位于世界前列,正在机器学习领域采用小数据方法。而小数据方法与大数据方法相比,可以节省更多的成本和时间。
像迁移学习这样的小数据方法如今被广泛使用。科学家利用转移学习来训练机器,使其能够在各个领域工作。例如,印度的一些研究人员使用转移学习来训练一台机器,只使用45个训练示例就可以在超声图像中辨别肾脏。迁移学习预计将很快增长。
使用人工智能的一个主要挑战是机器需要泛化,也就是说,为训练它们的问题提供正确的答案,因为转移学习就是转移知识。即使在数据有限的情况下也有可能实现。转移学习正被用于癌症诊断、玩电子游戏、垃圾邮件过滤等等。先进的人工智能工具和技术为利用小数据和变化过程训练人工智能提供新的可能性。为了训练人工智能系统,一些大型组织正在使用大量的小数据。
像迁移学习这样的小数据方法有很多优点。例如,使用数据较少的人工智能可以加强数据很少或没有可用数据的领域。尽管许多研究人员认为人工智能的成功需要大数据,但在这种情况下,迁移学习已被证明对于使人工智能应用多样化并进入未开发的领域至关重要。与大数据方法相比,迁移学习还有助于节省成本和时间。许多专家指出,迁移学习将成为机器学习行业的下一个驱动力。
各种小数据技术被用来训练人工智能识别对象类别。小数据技术被广泛用于提高不同行业和企业工作的效率、准确性和透明度。人工智能在员工的技能培训以及他们从较小数据集学习的能力方面发挥着重要作用。许多人工智能公司都在采用小数据开展业务。
上世纪的很多科学家使用小数据进行研究和发现,他们使用小数据完成了所有的计算。他们通过将自然法则归纳成简单的规则,发现了它们的基本规律。
研究发现,65%的创新都是基于小数据的。尽管许多企业使用深度学习通过将真实数据与合成数据混合来创造最佳性能,但并不总是需要使用大数据。小数据还可用于得出一些重要结论,尤其是在训练人工智能的时候。大数据有时会在机器学习方法中造成混乱。而采用人工智能是为了掌握知识,而不是处理数据。它涉及向机器提供知识以使其执行任何任务。
与大数据相比,小数据技术还没有受到太多关注。虽然没有多少人了解它的好处,但小数据可能很快就会变得非常流行。就科技行业而言,他们正在迅速从大型集中分析转向更加细化和智能连接的小型数据集。