杜小勇:用数据改变时代

发布时间: 2016.11.11   来源:超级管理员

见习记者 周洋

  在中国人民大学的北门边,有一幢普普通通的四层建筑,很少人会想到,中国高校首个以“信息”命名的专业就坐落在这里。作为第一个教育部数据库与商务智能工程研究中心,这里的实验室里每天都要进行着多项最尖端的数据库实验。很难想像,这些看似枯燥的字符运算,却关系着我们每个人未来生活的方方面面。

  杜小勇的办公室就在四楼走廊的尽头。“当我们越来越离不开手机、电脑、智能卡时,‘大数据’时代已经悄悄地到来了。”2012年盛夏,当见到来自家乡的记者时,忙碌的他脸上立刻洋溢起了亲切。他用一种温文尔雅的语调接受了采访。

  “大数据”让挑战与机遇并存

  试想一下,当40亿部手机、10亿台电脑,随时随地都在向分布在全球各地的服务器发送数据;当你走在大街上,对着手机说一声“韩国料理”,几秒后手机便收到了附近韩国料理店的地址;当一辆汽车在高速公路上撞上了护栏,短短10秒钟后路边的摄像头便向指挥中心发出了警报,迅速联系了最近的交警赶来处理,与此同时通过车牌找到了车主的电话号码……这是怎么做到的?

  “它们背后在向用户提供服务所涉及的定位、资料检索、存取、数据交换等一系列复杂的动作,全是由‘大数据’在做支撑。”杜小勇教授用一种最浅显的方式为“大数据”下了定义,“就是数量大,类型多,反应快的信息。”

  研究表明,全球企业数据正以55%的速度逐年增长。甚至有观点认为,如今只需两天就能创造出自人类文明诞生以来至2003年所产生的数据总量。“‘大数据’时代给信息产业的挑战是显而易见的,我们面临的问题就是将这些数据如何管理得住,如何储存得下,如何运用得起。”杜小勇说,目前他也在与学院的师生一同做着这方面的探索,“作为国家16个重大科技专项之一‘核心电子器件、高端通用芯片及基础软件产品’,也就是俗称的‘核高基’项目里,我们有一项‘非结构化数据管理’,可以看做应对‘大数据’的方法。‘非结构化数据’指的就是图形、图像、视频、音频、文本这类无法用一般数据库储存的数据。”杜小勇表示,近年很热的一个词语“云计算”,就是一种将这类数据通过互联网储存的办法。

  “‘大数据’在带给我们挑战的同时也存在着巨大的机遇,一方面迫使科研人员进行创新,不断带动起技术革新;一方面促使信息资产的经营,催生出更多信息咨询公司的诞生,企业可以获得更全面的商业信息;还有就是对于用户来说可以更好地满足便捷化、个性化服务。”

  旅日读博后他毅然选择回国

  在评师网站上,有位学生这样评价杜小勇:“超级喜欢杜老师,讲数据库基础课的时候他还教我们拿原理概论出去吃饭,幽默又有创意。尽管他当院长有很多行政工作,但对我们这门课的学生还是非常上心,问的问题引发很多思考。”谈到杜小勇,学生最关心的莫过于他那段旅日留学的非常经历。

  “这只是一个在时代背景下的选择而已。”1993年杜小勇在获日本政府奖学金后,赴名古屋工业大学开始了留学生涯。在刚开始的一年半预科生阶段,他主要专注于日语学习、学生工作和社会实践,“把很多心思放在社会活动上,在驻日使馆的帮助下,我与同学一同创立了学校的中国留学生学友会,并担任了首届会长。我们援助了留学生维权,宣传中华文化,还为宁夏贫困孩子募捐等等。只想做力所能及的事情。”

  而接下来读博士的三年,他潜心研究、致力学术。“我的导师是石井教授,他专攻人工智能,却鼓励我向数据库方面发展。”在这阶段,杜小勇向日本财团申请到了70万日元研究经费资助,还曾多次赴英国、法国、奥地利、瑞士、印度等国参加国际会议,与各国的学者探讨、分享最新研究成果。终于,1997年他以优异的成绩获得了博士学位,并留校成为日本文部教官助理教授,是该校计算机科学系第一位外国教员。这阶段,他拥有良好的研究环境,拿着丰厚的工资收入,过着稳定且富足的生活。

  然而,出人意料的是,他放弃了这种舒适,毅然于1999年回国,回到了他一直心系的母校——中国人民大学。“我知道我一定会回来,我不会一直呆在日本,这只是个时间问题。”杜小勇笑着说道,“没有人请我回来,只是自己想回来。因为在信息产业刚萌生的中国有着更大舞台。”

  回国后的杜小勇担任了人大新开设的计算机系主任,并与其他老师合作创办“人大金仓公司”。2000年开始,他开始投身“十五计划”与“863计划”中的“数据库管理系统专攻组”,并担任了组长。2005年,他担任了信息学院院长,并在同年开始了“核高基”项目攻关,成果运用到了国家多个重要部门,并推广实现了市场价值。

  信息人的乐趣与艰辛

  一本《衢州纵横》杂志,一罐开化龙顶茶叶,在杜小勇的办公桌上,很容易便找到了他与家乡的联系。

  1963年出生在开化的他,中学时便有不错的数学基础。于是,在1979年,他便选择了原杭州大学数学系的计算数学专业。因为条件限制,直到1981年学校才有了第一台计算机,并专门配了一个大教室做机房。“大三听老师讲汇编语言,看见老师能用任务驱动计算机,觉得很有意思,加上老师讲得好,我一下子就喜欢上了这门专业。”因为只有一台机器,为了要上机编程,同学们不得不把凌晨的时间都排了上去。“没有计算机我们就在纸上一遍遍地模拟跑程序,当时在那么艰辛的条件下我们都很刻苦。”

  杜小勇还清楚地记得自己毕业设计是与同学一起用计算机打出了中文,“我们就做‘点’,将汉字存在‘点’里。虽然今天看来是很简单的程序,但当时看见成果的我们兴奋到不行。”

  考虑到前途,杜小勇选择了留校当助教,并与老师一同将计算机做应用程序。“比如说根据历年的气象数据预测杭嘉湖地区桑叶产量,还有镇海炼油厂的炼油计划等。”

  1985年,工作两年后,杜小勇选择了报考中国人民大学的研究生。由于数据库是个新概念,觉得大有可为的杜小勇便投身其中。“当时帮国家信息中心开发分布式查询,用以人口普查,可以跨越全国各地不同的数据库。当时获得了国家表彰。”1988年,毕业后的杜小勇又选择了留校任教,1992年,杜小勇还就oracle数据库的研究出版了教材。

  人物名片

  杜小勇

  开化人,1963年出生,工学博士,中国人民大学信息学院教授、博士生导师、信息学院院长,兼教育部数据工程与知识工程重点实验室主任。

  主攻研究高性能数据库系统、智能信息检索、知识工程等。

上一页 下一页