据IDC预测,到2025年,152,000部新设备将直接或间接地接入互联网,从而将全球联网设备的总数升至800亿。其结果之一是,全球的数据总量将从2020年的44ZB飙升至2025年的约180ZB 。全球当前的数据总量为10ZB[1]左右。
一家智能工厂每天可生成1,000TB数据,无人驾驶汽车每秒可生成1 GB数据[2]。虽然这些数据的很大一部分转瞬即逝,但仍有很大一部分——比大多数人认为的还要大——将被保存、存储能和分析。
因此,我们将不得不重新思考如何管理数据,而且最终会得出以下结论:大多数数据,尤其是物联网数据,将不会“去”到数据中心或计算机,而是数据中心或其它计算设备来到生成和消费数据的地方。
智能建筑将监测它们自己的生命体征,在本地解决问题,并只向位于总部的数据中心发送它们的行为快照。为了避免云计算固有的时延,用于控制高速公路交通或分析店内客户行为的“快速数据”应用将受边缘计算设备控制。如果您对最新的电视节目上瘾,视频流亦不会来自互联网,而是您的机顶盒在网络并不繁忙的前一晚下载它(通过分析您的观看行为)。
计算将会无处不在,而且近在咫尺。
大数据的大局观
困境部分源于数据的本质。彼此隔绝的数据点互不相关。作为整体,马赛克式的信息能够解决各种神秘问题。您保存的数据越多,您的优势就越大,
以能源消费为例。智能电表已经能让供电公司消减用电的时间和成本。看一下美国的情况:联邦能源监管委员会估算,到2019年,供电公司通过软件动态降价的“需求响应”计划可将高峰用电需求降低188GW[3],从而能让社区推迟建设电站,并减少客户的用电支出。
但数据量增长很快。一个智能电表报告能够生成 50-100 千比特数据[4]。但如果您每分钟ping一下每家的电表,每年将会生成110PT数据。而这只是家庭消费的很小一部分:一栋商业建筑每年可生成100GB 数据[5],而这仅仅是(官方)官网入口和供暖数据。通过本地存储、分析和操作数据,您有可能以更低的成本获得更好的结果。
网络更多的是以线性方式演进。据Akamai统计,全球宽带网速每年提升约10%-15%[6]。为什么?因为钱。提高宽带网速需要安装设备、开发软件和雇用建设人员。
信息可能是免费的,但突破性的压缩算法和新型复用器不免费。
与此同时,很多物联网设备需要实时运行。一个只有在收到总部发来的信号之后才能关灯的智能灯具并不太智能。您想要的是能够在人离开房子后关灯、或能利用环境光线、或能通知店长5号过道有一卷尿不湿掉下的灯具。对于这些任务而言,即时的本地数据处理远远好于云计算。
正如市场分析公司Wikibon总裁David Floyer所言:“很多物联网数据将用于控制,因此应存储在本地,在本地分析,然后发送一个快照。”
边缘生活
在充当物联网和传感器网络的神经中枢,平衡二者方面,物联网网关将扮演关键角色。互联网连接和安全性将透过网关,后者还能存储原始数据,进行快速分析,并标记异常。物联网不仅将进入楼宇和家庭中,而且还将进入汽车,汇聚传感器数据,下载停车信息,并帮助您抵御病毒。
边缘数据中心将在地区一级扮演类似角色,复制本地社区的互联网,从而让消费者不用从遥远的拉斯维加斯或芝加哥获取网页,通过降低数据的传输需求降低流量。如果微软的Natick项目取得成功,时延和流量还能进一步降低,因为大城市中的很多人能够从附近的水下数据中心获取数据。
应留在本地,还是走向云端?
从成本效益的角度而言,留在本地一般都会胜出。假设您希望挖掘安保摄像头的数据,以5M/s的速度传输20个安保摄像头的数据将占用100Mbps带宽[7],并在五年期间支付约36,000美元的带宽费(根据Colocation America公布的费率)。如果在本地缓存数据,只将异常传输至您的数据中心,总成本将会降至约13,000美元。
没有人(或智能恒温器)是一个孤岛
这需要说服。“将其接入网络”或者将其发送到云端的冲动也许是最大的挑战。一个不联网的系统是一个孤岛。
没错。但一个边缘架构不会让智能设备成为孤岛,而是让它们组成群岛。
文章来源:机房专用(官方)官网入口 http://www.data-saturated.com