基因组学将占据大数据领域的绝大部分。一项新研究表明,他们海量的数据输入将产生最大比例的大数据,超过社交媒体所产生的大数据。
您的数据将会非常海量,大数据将会更大、更长。一组美国科学家刚刚在《PLoS Biology》杂志上发表论文称,基因组学,一门诞生仅十五年的科学,将在未来十五年内成为对大数据的最大贡献。
社交媒体不会像基因组科学那样产生那么多的电子数据。西蒙斯定量生物学中心的科学家和伊利诺伊大学厄巴纳-香槟分校的数据专家表示,不断上升的信息海洋将占据不断增长的大数据世界的大部分。
虽然社交媒体和整个互联网每年产生数百PB的数据并且还在不断增长,但基因组学也产生了真正疯狂的数字,据专家称,其数量和增长率都超过了这些。
生物科学,“四头野兽”
事实上,没有任何其他领域可能在 菲律宾电报数据库 大数据方面像基因组一样丰富,其目标是捕获、存储、处理和分析基因组中编码的生物信息。
如果基因组数据以目前的速度生成,它将每 7 个月翻一番。短短十年内,这一数字每年可能超过 40 EB。具体来说,到 2025 年,预计这一数字将在 2 至 40 EB 之间。
迄今为止,已经生成了近 250,000 个序列,相当于 25PB,但空间需求将猛增,到 2025 年,预计将有10 亿人的基因组完成测序。此外,随着这些手术的价格(目前只有最富有的人才能负担得起)变得越来越便宜,这个数字预计还会成倍增加。
报告认为将其转化为数字语言
以实现所有这些目标是一项重大 电子商务趋势:2024 年人工智能时代 挑战,并非没有障碍。他们指出,主要问题出现在获取、存储、分发和解释数据方面,这四个挑战使基因组学成为“四头野兽”。
您可能有兴趣阅读:
什么是多维数据库?
基因组学中使用的生物数据是分散的,因此 在此添加您的标题文本 存在缺乏集中化的问题,而集中化是获得研究最佳结果的关键。
研究得出的结论是,们的两个关键问题是分散性,因为“它们在许多地方生产和消费”,以及缺乏最低限度的同质性,因为它们甚至不符合最低标准,采用不同的格式。
随着基因组数据的不断增加,这些问题变得更加紧迫,从而导致理解基因组数据并将其用于包括医疗信息在内的各种科学目的变得更加困难。