数据中心最新文章 基于AFOPT-tree的最大频繁项集挖掘 1993年AGRAWAL R等人提出了一个重要的反映大规模数据中项目集之间有趣的关联或相关联系的研究课题[1],找出属性间有价值的关系,即关联规则的研究。频繁项集的挖掘是获取关联规则不可或缺的步骤。但挖掘频繁项集时需要考虑太多的候选项集。最大频繁项集中已经隐含了所有的频繁项集,并且在许多数据挖掘应用中也只需要挖掘最大频繁项集,而不是获取所有的频繁项集,因此对最大频繁项集的挖掘具有重大的现实意义。 发表于:5/6/2015 按事件时空联机分析处理与可视化 研究表明,犯罪在地理时空分布并不均匀,而是表现出一定的时空聚集特性,这种聚集性常用“犯罪热点”来表述[1]。通常犯罪现象高度集中的时段或区域就是犯罪热点。随着我国经济的发展和社会的转型,犯罪急剧增加,治安形势日益严峻[2],如何有效地找到犯罪热点,科学地配置警力资源,提高警务工作效率是一个值得研究的课题。 发表于:5/6/2015 一种基于HBase的海量微博数据高效存储方案 随着网络技术的快速发展,互联网用户激增,同时产生了海量的互联网数据。据不完全统计,截至2012年12月底,新浪微博注册用户数已超过5亿,每天新浪微博用户发博量超过1亿条。微博的使用人群数量基数大,状态信息更新频繁,信息传播迅速,这为研究网络用户行为与心理提供了充足的资源,也带来了挑战。 发表于:5/5/2015 淘宝商品评价属性分类研究 淘宝开放平台是一个综合性、商业性的开放平台[1]。TOP发布的API涵盖了商品、产品、类目、用户、交易、评价和物流等不同专业领域的开放接口。使用这些预先定义好的函数,可以更加方便、快捷地调用这些接口来完成一些有关处理工作。 发表于:5/5/2015 以户为基本单元的农村基础空间数据库研究 多年来,我国农业、国土、统计等部门通过调查、普查等方式建立了以村为基本单元的数据库。例如:云南“数字乡村”工程,基本建成了以自然村为基本单元的全省乡村基本情况数据库,涉及“三农”各个领域,内容涵盖自然资源、基础设施、农村经济、特色产业、人口卫生、文化教育、基层组织等方面[1];湖南“衡阳市基本单位数据库系统”也以乡镇(街道)、村(居)委会为基本单元进行建库[2];宁安市海浪镇长胜村基于整个村的信息资源,通过调查农民种植玉米、水稻、烟草等作物的过程中所需供、产、销信息,对所采集信息进行分类整理,建设了数据库和易于操作的农业信息化服务网站[3];黑龙江基础地理信息中心基于GIS构建农村资源管理系统,主要以“县—乡—村”三级行政区划为空间分析统计单元,通过电子地图、影像等各种表现手法整合各种农村资源[4];钱自红、沈超等设计开发了分别以乡、村和村民小组为基本单位,对房屋的建筑面积、结构、层数、人口、户主、产权进行查询统计,对房屋土地面积进行统计汇总的农村宅基地信息管理系统[5]。 发表于:5/5/2015 运营商的数字化服务战略思考 2015年第一季度对于中国电信运营商而言,过得并不是很舒服,甚至说有点焦虑。2015年1月~3月,电信业务总量完成5099.3亿元,同比增长22%,比1月~2月同比增速提高0.4个百分点,继续保持加速增长趋势。电信业务收入完成2769.3亿元,按可比口径测算同比增长2.9%。移动通信业务收入增速小幅回升,移动话音收入占比下降超过12个百分点。1月~3月,三家基础电信企业移动通信业务实现收入2020.5亿元,按可比口径测算同比增长2%,比1月~2月增速回升1.2个百分点。占电信业务收入的73%,比上年同期下降0.6个百分点。固定通信业务实现收入748.9亿元,按可比口径测算同比增长5.3%,与上月持平。话音业务收入占电信业务收入的比重降至32.8%,比上年同期回落10.1个百分点。移动话音业务收入同比大幅下降是主要原因,移动本地、长途和漫游等移动话音收入降幅均超过10%(按可比口径测算),在移动通信业务收入中的占比降至39.8%,比上年同期回落12.5个百分点。 发表于:5/5/2015 云计算模拟器研究综述 随着云计算的飞速发展,云数据中心的规模和密度日益增大,这给云数据中心的管理带来了诸多值得研究的问题,例如如何集中管理和动态使用数据中心里的虚拟机,以提高云计算的弹性和灵活性,从而降低运营成本,改善服务质量并降低管理风险;如何帮助用户构建动态、灵活、高效、适应业务增长的云计算基础架构,使企业在不增加运营成本的同时,保障业务的可持续发展。如果在真实的因特网平台上对这些问题展开研究会极其困难,也不现实,因为它需要考虑应用程序的开发者无法控制和处理的网络基础设施和环境。由于开发者无法对网络条件进行准确地预测或控制,这将最终影响策略的评价质量。 发表于:5/4/2015 自适应篮球视频图像分割 随着篮球娱乐事业的蓬勃发展,研究篮球视频图像的人也越来越多,而从篮球视频中获取到帧图像之后,首先要做的工作就是对源图像进行必要的分割。这是因为,通常篮球视频图像上都有很大一部分的观众席,而研究者的感兴趣区域只是比赛场地部分,所以有必要最大限度地将这两部分切割开来。对篮球视频进行分割有两个作用:一是大大减少了后续研究的工作量;二是消除了这部分数据对后续研究的干扰,有利于后续的图像分析[1],从而使得篮球赛事视频的镜头分割工作进展更加顺利。 发表于:5/4/2015 一种H.264/AVC快速分数运动估计算法* H.264/AVC是ITU-T视频编码专家组和ISO/IEC运动图像专家组共同制定的视频编码标准[1]。在保证图像质量不变的情况下,H.264/AVC的压缩效率期望比之前视频编码标准高一倍,高数据压缩率必然要求H.264/AVC编码方式较之前标准更为复杂。在H.264/AVC中,帧间预测占用60%以上编码时间,是影响编码器整体性能最重要的一个组成部分[2]。为了缩短运动估计时间,研究人员提出了不同的快速算法,其出发点都是在视频质量下降不大的情况下大幅度缩短编码时间,本文依据该思想提出一种通过减少分割模式来缩短编码时间的快速分数运动估计算法。 发表于:5/4/2015 Apriori算法改进研究及实现 数据挖掘是指从数据库的大量数据中提取出先前未知的、具有潜在实际价值的、隐含的信息[1]。关联规则挖掘就是从海量的数据中寻找数据项间的关联关系。 发表于:4/30/2015 多类型文档检索和转换技术研究 随着云时代的到来,企业内部的各种信息数据量也在飞速增长,正在步入大数据时代[1];企业内部每天都会产生大量的各种类型的电子文档[2],包括各种客户信息、产品信息、技术资料、培训资料等。如何对这些数量庞大、种类繁多的电子文档进行统一的管理,对于企业来说是一个亟待解决的问题。同时,对这些文档的有效分析和管理,对于企业分析客户信息、判断市场走向,以及构建企业知识库等方面都有很大的实际意义。 发表于:4/28/2015 大数据创业,数据哪里来?需要跨过几道坎? 2013年5月10日,在淘宝十周年晚会-马云退休演讲中,马云说:这是一个变化的时代。还有人没搞清楚PC,移动互联网来了;还没搞清楚移动互联网,大数据来了。而变化的时代是年轻人的时代。 发表于:4/27/2015 一种分布式无线同步数据采集系统设计 介绍了一种分布式多点无线同步地震数据采集系统设计方法。该系统以C8051F020单片机为主控芯片,利用GPS模块提供的PPS信号实现分布式采集系统的同步,利用无线射频模块Xbee-Pro实现数据的无线传输。 发表于:4/24/2015 10万颗美国芯 龙芯能否撑起天河超算? 没事不惹事,事来了也不怕事。”“天河二号”主任设计师卢宇彤借用主持人汪涵在湖南卫视节目《我是歌手》中说过的一句话,表达她对美国限售芯片事件的看法。她透露说,“天河二号”的升级目标肯定能实现,时间也在可控范围内。 发表于:4/23/2015 关于数字图书馆建设的综合分析 数字图书馆(Digital Library)是虚拟的图书馆,是在互联网环境的支持下产生的资源共享库。只要是合法的已授权用户,就可以通过网络在任何地点、任何时间,最大程度的获取知识所需要的资源[1]。“数字图书馆”是用数字技术处理和存储各种图文并茂文献的图书馆,它是一种多媒体制作的分布式信息系统,把各种不同载体、不同地理位置的信息资源用数字技术存贮,以便跨越区域面向对象的网络查询和传播的一个大型信息系统。 发表于:4/22/2015 «…195196197198199200201202203204…»