“互联网+”时代的到来,互联网、社交网络、物联网、移动互联网、云计算等相继进入人 们的日常工作和生活中,并潜移默化地改变着用户的意识形态。高校信息化被迫要求扮演多元 化的角色,对高校的信息化建设提出了更高的要求。《教育信息化“十三五”规划》明确提出 要建设“智慧校园”,高校由“数字校园”逐步迈向“智慧校园”,不断探索“以数据为核心 资产、以数据驱动业务革新”的发展模式已成为我国高校向“双一流”迈进的必然趋势。数据 的体量越大、维度越多,就越能够更好地为用户精准分析和个性化服务提供更多潜在的信息。
在数据挖掘驱动教育、变革教学的“互联网+”时代,教育领域同样蕴藏着具有广泛应用价 值的海量数据。探索教育变量之间的相关关系,进行大数据的教育应用,为教育教学提供有效 的决策支持服务,促进教育教学的变革与创新,成为十三五期间构建“智慧校园”的新型课题。
高校信息化正面临怎样的问题?
在“十二五”至“十三五”期间,我国高校已基本迈入信息化时代。高校在不断整合业务 流程、打破数据孤岛、统筹线上管理、享受信息化建设和快速发展带来丰硕成果的同时,也逐 渐面临着数据标准不统一、数据源头不清晰、数据流转不顺畅、数据应用不能满足需求等一系 列问题,给教学、科研、管理及服务造成了诸多不便。支撑数据获取不便,或无从获取,或从 不同渠道获取数据不一致。在未来“智慧校园”的建设中,高校迫切需要更为便捷的信息化手 段支撑教学、科研、管理及服务工作,建立完善的数据服务平台,实现对数据的安全、规范的 采集、存储、交换及应用,是实现个性化管理服务的基础。
在上述内在和外在的需求背景下,高校制定统一的数据标准、实现业务系统数据、机器数 据及公共数据的高度融合、构建稳定且半开放的数据平台必需且必要。开展数据治理工作,解 决当前数据共享中存在的“数据质量不高、数据流向混乱、共享度不足、历史数据缺失”问题, 实现对高校数据中心的重构,构建数据治理平台,对高校业务系统数据有序且规范化地进行梳理、采集、清洗、标准化规范存储和应用,实现学校数据资产的有效管理和数据的深度共享。 抽取并整合全校所有业务系统的结构化数据,以及各系统运行日志和互联网数据等非结构化数 据,按主题分类进行数据梳理,用于学校在管理、科研、教学及服务改革等业务层面宏观的统 计、挖掘、预测。同时,深度治理后的数据能够在教学、科研、管理等多方面全面服务于高校 发展,其意义主要体现在:深入促进服务创新和价值创造、有效提升管理和决策水平、提升校 园数据质量和数据可信度、提高合规监管和安全风险控制,使高校师生能够充分享受大数据带 来的个性化及贴心化服务。
高校教育大数据治理的目标
数据标准规范化
数据标准是在高校数据平台框架下,保障高校内、外部使用和交换数据的一致性和准确性, 具有行业特点且共同使用的一种规范性约束。数据标准是高校数据平台数据治理的基础,亦是 数据治理建设中的首要环节。一方面,数据标准为高校数据平台提供统一的数据标准定义和平 台逻辑模型;另一方面,数据标准是高校数据平台进行数据治理的依据和根本。数据标准是衡 量高校数据平台数据资产运营和管理的评估依据。数据标准规范化的管理内容包 括:构建基于校情的数据管控制度及数据标准管理组织、制定基于数据流程的规范性文件、实 现信息项数据字典标准的规范化定义。
数据管理脉络化
通过对数据流的梳理,可以看出数据管理的任务是构建元数据进行集中式的管理。在高校 数据范围内,元数据主要描述了各业务系统的数据范围、数据类别、数据定义、数据表之间的 关系以及数据流等信息。数据管理是元数据的创建、存储、整合以及控制的一整套流程的集合, 用以辅助在高校场景内开展各类元数据应用。
通过对元数据的管理,大数据治理达到如下目标:
①提供校级数据字典,便于内、外部准 确掌握高校的数据概况;
②提供全局元数据查询检索,便于快速定位元数据;
③提供元数据详 细描述,便于快速了解数据组成、数据结构及数据流向;
④提供血缘/影响分析功能,便于进行 分析判断、问题定位;
⑤提供元数据接口服务,便于其它系统或模块使用元数据,实现数据交 互与共享服务;
⑥提供元数据应用,方便终端使用元数据。
高校元数据的特点在于逻辑相对趋 于集中,即将元数据管理作为统一的发布源,采用集中式的元数据管理模式,提供元数据的集 中创建、维护、查询功能,不断趋于脉络化。
数据质量度量化
数据质量深度反映了数据的“适用性”,即数据满足使用需要的合适程度。数据质量通过 完整性、一致性、准确性、及时性、合法性等多类维度进行度量。数据质量的度量化工作旨在 定义数据质量标准、建立数据质量审核机制、跟踪数据质量的全生态过程,为数据平台提供洁 净、结构清晰的高质量数据,是数据平台开发数据产品、提供数据服务、发挥大数据价值的必 要前提,是高校数据资产管理的关键因素。
数据质量度量化的目标是:为高校内、外部用户提供平台化的数据质量监控,通过扩充和 优化公共规则库、增强后台对不同类型数据仓库和非结构化数据的兼容性,提升用户使用感受,并提供数据质量应用满足个性化需求。
数据内容精简化
业务数据、系统数据、机器数据、日志数据等形成了高校的结构化数据和非结构化数据集 合。数据源的多样性,严重制约了数据交换与共享。数据内容的精简化工作旨在消除重复数据、 修正错误数据、实现数据的多次清洗、完成基于数据标准的转化等,以降低数据维护成本。
本文节选自:CNKI,作者:余鹏、李艳。