药智论坛

查看: 2960|回复: 0
打印 上一主题 下一主题

数据的安全背书

[复制链接]
跳转到指定楼层
主题
发表于 2015-8-19 10:15:58 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式 来自 韩国
在大数据背景下,高校教学服务和数据利用方式发生了显著的变化,并因此带来新的机会。随着业务越来越多,高校数据中心也变得更加复杂庞大,同时数据交换量也越来越大,对数据中心的安全性、可靠性提出了更高的要求。
  “我们是按照数据仓库的概念来进行信息化建设的,正如一些专家所认为的,现在的大数据并不是真正意义上的大数据。只是因为大数据比较热,所以就把数据仓库这瓶老‘酒’装进大数据这个新‘瓶’里去。”兰州大学通信网络中心副主任李仲贤告诉记者,目前数据仓库的高端模型都没有实现,数据仓库建设仍然在路上。
  数据中心基本架构
  兰州大学新一代数据中心的基础建设工作包括公共数据中心、统一认证和虚拟化平台等,进而在其基础上建立统一业务平台。
  据了解,兰州大学数据中心承载的业务主要有三类:一是公共信息服务,如网站、邮件、云存储等;二是教务、财务、政务等业务平台;三是一卡通、网络管理认证及其他业务。同时,中心已建立基于CitrixXEN的虚拟化平台和基于IBM 740的Oracle RAC数据库系统,很大程度上降低了中心运维成本,提高资源使用率,同时也得到更高的可用性和可靠性。然而,虚拟化和集中化数据库的引入也带来了安全问题,虚拟化系统存储、网络等资源共享和虚拟机迁移等特性也都暴露了潜在的安全威胁。因此,在网络安全设计上,需要将资源使用和安全问题综合考虑进来,合理使用虚拟化平台。当前,虚拟化安全问题尚未很好的解决,为了安全起见,一些敏感的服务仍旧运行在物理服务器上,如财务服务、一卡通服务等。对于像电子邮件这样,也比较敏感,且服务器资源消耗大,但是又对外开放的服务,也需要将其运行在物理平台,并单独考虑安全级别和方案。数据中心架构如图1所示。

  数据粒度要细
  根据IDC相关数据显示,互联网上的数据每年将增长50%,每两年将翻一番,而目前全球互联网90%以上的数据是近几年才产生的。网络作为大数据时代的重要信息资源,使得人们的生活、工作和学习都离不开计算机和网络,然而,值得注意的是,人们在享受网络带来的便利的同时,也应看到高校网络面临着一系列安全问题。
  “安全问题一直是我们关注的,目前看来,人员流动和设备安全是个问题,如果出现人员离职的情况,那么有可能会出现信息泄露,因此一些敏感的数据最好不要放在公有云中。”李仲贤指出,数据中心建设中主要的问题还是对虚拟化软件研究的不够透彻,例如一个管理员改动虚拟化交换部分,导致所有的虚拟机都不能访问,虚拟化后机器数量很多,这种问题很致命,解决的办法也很简单,但是所有鸡蛋放在一个篮子里时对安全性可靠性要求就更高。
  此外,数据的粒度也要足够细,例如,在一万条学习数据中,如果希望家庭住址这一项是安全的,或者某几项涉及隐私是安全的,这就需要很细的粒度。对此,学校进行了一些尝试,实现单点登录,即在云端进行任何操作都带着个人身份的标记。如果存储数据有敏感数据,可以预先进行各种加密策略。这种加密策略除非用高性能计算来破解,否则一般的技术水平是破解不了的。
  在谈及数据存储问题时,李仲贤坦言,尽管结构化数据比较少,但是每天移动终端等设备产生的非结构化数据量非常大,这也给数据存储带来一定压力。
  “对于放置数据的云主机,我们要求不能随便安装其他软件或系统。如果部门用户有存储或者有相关需求,就需要自行选择备份和处理。数据中心能够为其提供某些时间节点的恢复,但无法保证全部实施。”李仲贤进一步补充道,实际上,高校的结构化数据量级很小,大量的数据主要是非结构化的多媒体数据,在知识产权保护以及数据安全方面需要解决的问题很多,尤其需要对数据细粒度的权限管理,目前这方面缺乏行之有效的技术手段。
  打破“信息孤岛”
  由于各业务系统的建设与管理分散于各部门,学校往往会出现“信息孤岛”的情况。对此,兰州大学进行了整合,但是学校的某些部门又会制造新的“孤岛”。
  将“云、大数据这些热词落到实处的主要还是虚拟化技术,这样使得我们的IT部门的支撑能力更强大,随时可以按需提供IT资源,我想目前管理类的系统中沉淀的数据对于辅助决策意义很大,目前这方面我们还在努力。”李仲贤告诉记者,很多高校在经费上都比较宽裕,目前云平台下的计算能力足够强大,但是网络方面依然存在瓶颈,要提供一个上万人同时使用的平台难度依然很大,学校在这部分还是做了一些分布式设计,同时也需要能发挥云平台威力的好软件。大数据的出现为云计算的实际应用找到了更大的舞台,大数据通过利用云计算的超强大的数据存储以及数据计算能力,可以更加方便地处理海量信息,为用户提供了更方便、更快捷的服务。
  “大数据与云计算天生是一对,大数据意味着大的运算量,一台机器远远不能满足,并且数据维度会增加,数据之间也会有交叉,这与当前‘互联网+’有相似之处。由于数据之间进行交叉,那么久需要从多个维度、多个层次去分析数据,这对计算的要求就非常高,而云计算能够很好地提供便利,如果需求量大就配多个CPU和内存来承载相应的工作。”李仲贤说,目前,高校图书馆的数据非常庞大,通过这些数据可以对学生的行为进行分析,不过这涉及学生的隐私。“在数字化时代,学校的核心数据都被保存并做备份,若干年后,这些数据也许会有价值,未来有需要也可以帮助领导进行决策。当然,数据也有历史的局限性,20世纪80年代的数据才有了照片,但这不能说明数据质量不高。另外还有一些非机构化数据,比如一些名师的发言录音等,我们都会进行多次备份。”
  可以看到,云计算为大数据提供了更多可弹性扩展,廉价的存储空间和计算资源,而且其提供的资源不仅种类繁多,并且分布广泛,是高校异构系统处理数据的有力方式,因此,在大数据时代下,高校教育将会朝着更多方向发展。
  “在数据服务方面,我们仅仅做到了对数据的简单加工处理以及各种呈现,深层次的数据价值还无法快速提供服务,目前主要还是基于XML方式提供各种基础数据,距离真正的数据服务还差得很远。”李仲贤进一步补充说,随着智能手机的普及,很多高校的管理系统已经非常完善,但是想要非常好地支持终身学习、泛在学习的教学平台还有很大需要提升的空间,结合大数据对学生的学习行为进行分析,实现个性化的精准教学和辅助教学,这会是学校未来主要关注的方向。

您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

QQ|论坛规则|(渝)-经营性-2021-0017|渝B2-20120028|前往 违法和不良信息举报中心 举报|药智论坛 ( 渝ICP备10200070号-7

渝公网安备 50010802004459号

GMT+8, 2024-4-23 21:05

快速回复 返回顶部 返回列表