欢迎来到优发表网

购物车(0)

期刊大全 杂志订阅 SCI期刊 期刊投稿 出版社 公文范文 精品范文

大数据运营分析范文

时间:2024-02-21 14:45:12

序论:在您撰写大数据运营分析时,参考他人的优秀作品可以开阔视野,小编为您整理的7篇范文,希望这些建议能够激发您的创作热情,引导您走向新的创作高度。

大数据运营分析

第1篇

【关键词】 大数据 电信运营商 4V Hadoop Spark 流计算

一、引言

大数据的应用是在互联网的高速发展中诞生的。谷歌提出了一套以分布式为特征的全新技术体系,即分布式文件系统(GFS,Google File System)、分布式并行计算(MapReduce)和分布式数据库(BigTable)等技术。这些技术奠定了当前大数据技术的基础,可以认为是大数据技术的源头。

二、大数据发展现状

近年大数据的发展呈现以下两个特征:1)互联网公司引领大数据发展。互联网公司在搜索、广告领域积极采用大数据技术优化既有业务。二是今年以来陆续推出一系列面向第三方的大数据服务。2)传统企业大数据应用仍处在探索期,发展渐趋理性。传统企业在大数据应用的思路上也在纠偏,更加务实。一是更加注重更干净、结构化小的数据。二是更加注重企业自身沉淀下来的内部数据的价值挖掘。三是更加注重根业务需求把Hadoop 与传统数据仓库结合起来用。

三、大数据关键技术

1)大数据存储管理。传统的单机文件系统和网络系统要求一个文件系统的数据必须存储在一台物理机上,在冗余性、可扩展性和容错能力和并发能力上难以满足大数据的需求。2)大数据计算能力。传统的数据计算能力的提升依赖于扩容单机的CPU性能、增加内存、扩展磁盘等方式,难以支撑平滑扩容。以MapReduce为代表的分布式并行计算技术可以通过低成本的通用服务器搭建系统。通过添加服务器扩展系统的总处理能力。3)大数据分析技术。大数据分析主要在两个方面,一是对海量的结构化和半结构化数据进行高效率的深度分析,如从文本网页中进行自然语言分析;二是对非结构化的语音、图片和视频进行机器可以识别的分析提取有用的信息。

四、大数据的主流技术

1、Hadoop。Hadoop是基于Java语言开发,以分布式文件系统和Mapreduce为核心。其特点如下:1)可扩展性:Hadoop运行在基于X86结构的普通PC服务器或刀片服务器上,硬件和软件松耦合在一起,可以很方便的增加计算节点。2)可靠性:Hadoop能够自动保存数据的多个副本,并且能够自动将失败的任务重新分配,确保能够针对失败的节点重新分布计算。3)低成本:Hadoop架构在廉价的硬件服务器上,不需要昂贵的硬件作支撑。其软件是开源产品,不需要授权费用。4)高效性:相比传统并行计算结构,Hadoop的计算和存储是一体的,实现任务之间无共享,I/O开销小。

2、Spark。Spark拥有MapReduce的优点,但不同于MapReduce的Job中间输出,其结果可以保存在内存中,从而不再需要读写HDFS。其有以下特点:1)速度快。Spark支持内存计算,对于小数据集能达到亚秒级的延迟。2)易于使用。Spark支持Sscala、Java和Python编写程序。Spark提供了超过80个高级运算符,以便于更容易的构建并行应用程序。3)与HDFS底层兼容。Spark能够运行在Hadoop 2.x的YARN集群管理器上,并且能够读取任何存在Hadoop数据。

2、流计算。流式数据是指将数据看作数据流的形式来处理。数据流是在时间分布和数量上无限的一系列动态数据集合体;数据记录是数据流的最小组成单元。流计算的技术特点如下:1)实时性。流数据是实时产生、实时计算,结果反馈往往也需要保证及时性。2)易失性。在流计算环境中,数据流往往是到达后立即被计算并使用,只有极少数的数据才会被持久化地保存下来,大多数数据往往会被直接丢弃。3)突发性。在流计算中,数据的产生完全由数据源确定,由于不同的数据源在不同时空范围内的状态不统一且发生动态变化,导致数据流的速率呈现出了突发性的特征。

五、主流技术方案比较

目前大数据平台建设最常见的是基于Hadoop平台和MPP数据库的两种方案。Hadoop、MPP数据库和传统数据库并非是互相取代的关系。因此,在很多大数据解决方案中,单一大数据技术无法满足所有的要求,而是要根据实际场景采用不同的技术方案或采用混搭架构进行综合处理。

六、电信运营商大数据部署建议

大数据平台建设目前有两种方式,建议采用第2种方式:1)以现有分析系统BI为基础,进行扩展,构建统一开放数据平台。2)以统一数据管理为契机,通过数据统一采集、存储与处理入手,新建大数据平台。方式2可迅速汇聚数据,不影响现网各系统的运行,后期可将经分,性能管理等系统上移为数据集市,专注于专业分析。各数据源仅将数据送往大数据平台。

大数据技术架构建议按照“松耦合、标准化、分层开放”的标准进行方案选取。而在数据层面,运营商面临数据规模大,数据处理复杂,数据结构多样化等多种挑战。无论是传统数据库还是分布式数据库,均难以单独满足数据存储和分析的需求。大数据平台建议采用Hadoop作为大数据的主要存储平台,各分析集市、应用系统可根据数据分析的深度,实时性采取Hadoop,Spark或MPP混搭架构。

参 考 文 献

第2篇

>> 电信运营商大数据引入策略分析 电信运营商跨行业大数据融合应用场景分析 大数据时代下的电信运营商变革 运营商大数据要去电信化 电信运营商大数据应用系统建设方案研究 供应链视角电信运营商的大数据应用方向探讨 电信运营商真正的优势在于大数据分析 电信运营商大数据业务运营流程深度剖析 运营商大数据技术及应用 中电信“天翼大数据”品牌 运营商能否做好数据买卖? 大数据时代电信运营商4C营销策略探析 大数据时代电信运营商如何重构转型竞争力 电信运营商大数据在金融行业实体选点中的运用 电信运营商大数据发展策略与价值挖掘 大数据时代下电信运营商的发展战略探讨 电信运营商大数据变现之关键技术 电信运营商大数据资源变现模式及策略研究 电信运营商FTTX应用模式 运营商部署VPLS案例分析 数据挖掘在电信运营商经营决策系统中的应用 常见问题解答 当前所在位置:l.

[2] 傅志华. 大数据在电信行业的应用[EB/OL]. (2014-11-17). http://.cn/Bigdata/2014-11/17/content_1479083.htm.

[3] 晓镜. Sprint:运营商仅靠大数据就能生存[N]. 中国邮电报, 2012-11-21(5).

[4] 朱敏. 大数据时代运营商战略及市场影响[J]. 中国电信业, 2015(5): 78-79.

[5] 何非,何可清. 大数据机器及其科学问题与方法的探讨[J]. 武汉大学学报(理学版), 2014(1): 1-12.

[6] 洪莹,李政. 针对电信运营商的大数据价值化经营研究[J]. 移动通信, 2015(13): 47-50.

[7] 黄勇军,冯明,丁圣勇,等. 电信运营商大数据发展策略探讨[J]. 电信科学, 2013(3): 7-11.

[8] 施巍巍. 大数据助力电信企业实现精确营销[J]. 信息技术与信息化, 2015(1): 92-94.

第3篇

最近读完了《幸福的方法》,对书中一段话非常有感触:"忙碌奔波型是未来的奴隶,享乐主义型是现在的奴隶,而虚无主义型则是过去的奴隶。"在运营商工作的我们都经历过从通信业黄金十年带来的"金饭碗"、行业遭遇"高原平台期"的铜饭碗,甚至全社会"人人得而诛之以后快"的"纸饭碗",无论是企业还是身处其中的个人,都在感受着巨大的压力与阻力。

于是,一些人选择了"享乐主义"式生存,日复一日在单位混日子;一些人则选择了"虚无主义"式生存,沉浸在过去的辉煌,躺在功劳簿上过日子;还有一些人选择"忙碌奔波"式生存,开不完的会、做不够的汇报、写不尽的方案,虽终日忙忙碌碌却无所作为。正是如此,才有了我上篇文章中写到的"四种人"——那些想走又能走的人最终选择了离开这里,那些想走却不能走的整日抱怨体制,那些不想走也不能走的昏昏度日,剩下那些能走却不想走的痛苦挣扎……

一、运营商正在经历什么?

借用双城记那段经典开场白:这是一个最好的时代,这是一个最坏的时代。对于运营商这样天生依靠人口红利、规模红利的传统企业,未来的日子或许并不好走。无论是从媒体的口诛笔伐,还是用户的人人喊打,亦或是员工的纷纷出离,种种迹象都在表明这个行业早已从大象快跑的“神坛”跌落,变得迟钝、缓慢甚至有些狼狈了。

可十年前绝不是这样。三十年前更加不是。

《大跨越:中国电信业三十春秋》的开篇语这样写道:从经济瓶颈到社会先导,从全球末游到用户总量世界第一,改革开放三十年中国电信业实现了举世瞩目的大跨越!这一切是怎么得来的?这本生动再现改革开放30年来中国通信业辉煌历程的著作选择了两个有意义的时间点,1978年跟2008年,前者是中国正式吹响改革开放号角的关键一年,而后者则是代表了通信业黄金十年的关键一年。

字里行间都可以读到中国通信业经历过怎样的辉煌,可以感受到从业者那种由衷的自信与荣耀。时代巨变,昔日巨头创造了比以往更加令人瞩目的经营业绩,却在政治地位以及行业形象上连连败走麦城。

时至今日当我们再次谈论运营商,你想到了什么?是财务报表上无比闪耀的光辉业绩,还是面对行业内外竞争暗战的困惑焦虑;是建成一张张4G、4G网络的骄傲欣喜,还是管道化、低值化、边缘化的郁闷心酸;是对KPI下多少就能完成多少的自信得意,还是对基层不断涌现离职潮的始料未及。

是运营商真的做错了什么吗?可能并不是。

放眼看看这个时代吧!这是一个在和同行不断抗衡,却无奈被OTT抄了后路的时代;一个到处充斥着机会,细看时却满目危机的时代;一个传统大机构失势瓦解,个人自由连接全面崛起的时代……

这是一个唯变不破的大时代。在这个时代里,竞争对手变了、游戏规则变了、用户习惯也变了,曾经习以为常的一切突然间发生了天翻地覆的变化。话音、短信这些传统业务正在加速下滑,流量虽然成为新的增长点,却不得不面临着“提速降费”的巨大压力。可以说,在这样的时代背景下,运营商像是被困的巨兽,想挣扎却又充满无力感,想改变却又害怕不确定,想突破却又找不到突破口……

唯一的方法大概就剩下三个字:豁出去。

二、运营商该怎么办?

对于眼下的运营商来说,出路无非两条,要么精耕存量客户,挖掘更大的价值点;要么开辟新市场,寻找行业的破局地。关于精耕存量市场,已经有太多这方面的文章,这里不再赘述。我想重点谈谈新市场。

1.新市场在哪里?

日前,互联网教父、科技商业预言家的凯文·凯利在斯坦福大学进行长达3小时的分享,畅谈他对未来20年重大科技商业潮流的见解。我对其中一个观点很感兴趣,他说不管你现在做什么行业,你做的生意都是数据生意。

数据!

无论是风生水起的移动互联网,还是改变世界的芸芸众生,他们都在通过运营商的网络来获取信息。

2014年三月在北京举行的一场大数据产业推介会上,阿里巴巴集团创始人马云在主题演讲中发表了他的观点——“人类正从IT时代走向DT时代。IT时代是以自我控制、自我管理为主,而DT时代,它是以服务大众、激发生产力为主的技术。”

我们都知道,今年的双11全球狂欢节中,阿里巴巴天猫用时不到12小时就打破了去年创下的571亿元的交易额,最终将记录锁定在912亿,其中无线交易占比71%,全球产生成交的国家和地区达到205个。

巨量交易额的背后是什么?是阿里越来越强大的供货和物流系统?还是传统零售业的全面没落?其实都不是的。我以为这背后体现了阿里巴巴强大的数据分析和挖掘能力。在这样的购物节中,最重要的问题是商家要备多少货?而这可以通过平台历史销售大数据,预测货品需求,为商户提供库存依据,提升库存效率和有效性。

而在百货商店时代,购物数据只有通过人工才有可能统计完并且不一定准确,但是阿里巴巴会把每个人的历史购物和浏览数据都留在云上。因此,淘宝可不光是一个电商平台,更是顾客的大数据平台。

阿里巴巴集团副总裁涂子沛在讲到这个概念的时候举了一个更容易理解的案例:请你预测全国哪些地区会有更多的二孩出生?按照传统的数据统计,估计只能依靠人口普查、各地市区县统计部门的层层上报,不但会有偏差而且还会滞后。而在阿里巴巴,只需要统计哪些区域的孕婴用品销量激增就可以了,不但真实而且更加便捷。

运营商也是一样的。你以为运营商只是通信管道的提供者?其实或许还是信息适配的服务商。在过去,我们使用的文件、文件夹、桌面这些东西都是停留在本地的。我还记得那个时候最好的备份工具大概是移动硬盘或者是蓝光光盘之类的东西。而进入网络时代之后,数据就出现在网页上、链接里。现在的云上有标签、有流量、有新闻,还有各种各样我们需要的信息。云、数据化才是这个时代的关键词。要知道,这些所有的信息都是通过运营商的网络传输的,就和从淘宝上销售的商品信息一样,除了信息本身,它的发送端和接收端或许才是我们关心的重点。

于是,将合适的信息主动推送给需要的人,就是运营商能提供的大数据服务了。

2.新市场有多大?

中国云计算技术与产业联盟理事长吴基传曾指出:大数据是云计算服务的基础,是构架云平台最基本的要素,没有对海量信息的分析的大数据,就没有为所有信息消费者获取有价值的信息的可能性。

因此在商业界,大数据已经开始成为很多企业的生意。《2015年中国大数据交易白皮书》显示,预计到2020年,中国大数据产业市场规模将超过这个市场去年规模的10倍,由2014年的767亿元扩大至8228.81亿元。

2015年8月19日,国务院常务会议通过《关于促进大数据发展的行动纲要》,这或许意味着,大数据在中国将逐渐步入正轨,进入到顶层设计时代,这无疑将加速经济发展引擎的进一步开发。

从运营商的角度来看呢?以中国移动为例,我们有超过8.2亿用户,110万4G基站,经营分析系统里有10B以上的数据,我们的10086每分钟都有海量用户的呼叫,实际上所有这些动作每天都在产生大量的数据。那么,这些数据到底有多大,集中以后会是个什么效果?

有人曾经做过测算,一个省公司一天的数据要上百P,这些数据集中在一点传输到中国移动(贵安)大数据中心,需要重建一个中国移动的CMNET,也就是中国移动Internet的骨干网。

所以某种意义上来说,运营商拥有采之不尽用之不绝的数据富矿,站在金矿上总比无矿可挖强,这也是我判断运营商或许会在大数据时代“触底反弹”的依据之一。

3.还有什么不确定因素?

虽说前途可期,但毕竟是一个全新的领域。在新领域就一定有新的游戏规则,也会有相应的规则适应过程。

在过去的几年中,大数据的概念在产业界引发了无数的争议和讨论,甚至长期出现在Gartner的新兴技术成熟度曲线(也称新兴技术炒作周期报告)中。原因非常简单,一项新技术多被谈及概念,虽然在媒体上屡屡曝光,但应用案例寥寥。

因此,大数据越来越被看做是评论界的谈资,而非真正意义上的产业。

在贵阳成立的全球第一家大数据交易所,通过电子系统面向全球提供数据交易服务,计划2020年数据清洗交易量年达1万PB、年总额3万亿。然而,成立至今,这个深孚众望的机构撮合的交易记录也不过3000多笔。“有意愿交易大数据的企业和机构还不多。”交易所工作人员如是说。

除此之外,还有几个关键不确定因素在影响着大数据产业发展。

A.技术能力不足。IT作为后端的支撑手段,大量通过外包或采购方式实现,所以在自身软件开发和大数据平台运维、大数据新技术应用、大数据分析挖掘方面能力相当有限。

B.数据“墙”大量存在。很多数据是分散在不同的系统中的,经过长时间的“竖井”式运作,已经形成了难以突破的壁垒。以中国移动为例,B域主要是经营分析数据、O域主要是网络运维数据、M域主要是管理信息数据,但这三域的IT系统分别由三个不同的部门负责,整合难度较大,较难形成“1 1>2”的数据融合效果。

C.组织架构不匹配。目前看,很少有机构会设置专门的部门去集中各种散落的数据,更别提对这些数据进行标准化的管理和维护了。

D.思维观念的滞后。如果说技术、资金、人才方面的劣势都可以通过后天的努力来补足,那么意识层面的缺失就需要相当长时间的培育了。

除了以上说的几点,大数据交易的安全性、定价的合理性、客户信息的保密性,都在一定程度上影响着大数据业务的规模和发展空间。

三、运营商玩大数据的心法与身法

运营商究竟该怎么玩儿大数据呢?窃以为先要回答好三个问题:一是数据在哪里?二是数据放哪里?三是数据怎么用?

1.数据在哪里?

都说我们正在经历一个全新的商业时代——分享经济的时代,消费者正在放弃传统的、效率低下的企业,转而投入分享型企业的怀抱,来获取他们想要的产品和服务。Uber让座驾更好地分享,Airbnb让空闲的房屋更好地分享,八戒网让创意和设计更好地分享……现在看,一切可以分享的都是价值数据。

在分享经济的时代,真正分享的是有效的供需关系。因此,在分享经济中,更重要的其实是创建供需场景,建立供需联系。

数据也是相同的道理。随着移动互联网、云计算、物联网等新一代信息技术的爆发式发展,智能手机、平板电脑、可穿戴设备以及遍布各个角落的传感器,正在越来越多地接入到运营商网络。各种交互数据、传感数据正源源不断从各行各业迅速生成。这些数量庞大、种类广泛、迅速产生和更新的大数据,蕴含着前所未有的社会价值和商业价值。

如何能够有效挖掘并体现出数据的价值是亟待解决的问题。窃以为,关键就在于建立数据使用的场景并搭建数据交易平台。

比如说,城市规划设计院需要对新区进行商业价值评估,可以通过运营商的网格数据分析提供区域人口及经济状况解析;再比如,医疗机构需要在一段时期对药物及医疗设备做储备,可以通过医保报账平台统计该区域的医疗诊断及药物使用情况,预测出该区域可以发生的大规模疾病,从而及时储备相关资源。

重要的是,帮助数据消费者更加迅速有效地找到他们需要的数据,并促成双方交易。

2.数据放哪里?

如此大规模的数据存放在哪里也是考验大数据产业的要素之一。要知道并不是所有的机构都有足够的资源去建设自己的数据中心。而在这方面,运营商恰好可以提供服务。

通信行业有个词叫做“电信级服务”,意思是通信服务要具备不间断运行、大容量、高稳定性、可靠性等特点。而要达到这些条件,就需要完备的QoS保障机制,而其中重要一环就是设施先进、管理规范的通信机房。

因此可以说,在数据机房方面,通信运营商具有先天的优势。

能否将此作为运营商进入大数据市场的切入点呢?开放、合作就成了这个部分的关键词。前文说过,传统机构中有很多数据与信息孤岛,要想打破不断构筑的“数据墙”,首先是要将他们集中化的存储、管理、运营。因此,运营商的高标准数据中心或许只是一个必要而非充分条件,要让源自不同领域的数据发生“化合作用”的前提是将这些数据存放在运营商的数据中心。

ICT基础设施有连接和存储的作用,其产生的数据通过不同的终端存储下来,这些数据在应用程序中使用才会有价值。而运营商同时具备连接和存储两项功能。

面向未来,运营商数据中心将成为网络的中心,构建面向业务的敏捷、柔性、绿色的云IT基础架构将使运营商数据中心成为新一代ICT基础设施的驱动中心。

3.数据怎么用?

运营商现在最大的挑战是什么?是端到端的质量保障不足导致用户体验还不够好吗?是受到OTT业务的冲击导致传统业务快速下滑吗?还是业务量收剪刀差不断加大、投资压力日趋吃紧吗?个人认为都不是的。我们最大的挑战在于用户往往满足于现有的业务。这会让我们产生严重的路径依赖,从而也会形成“自满”情绪。

事实上,运营商现在面临着三大重要转变:一是从关注功能向关注最终用户体验转变;二是从提供语音和带宽向提供丰富、开放的ICT融合信息服务转变;三是从基于人口红利的增长向应用创新增长转变。这三个转变带来了商业模式、运营模式、研发模式和科技创新的转变,将驱动电信行业从封闭走向开放的数字化运营。

数字化运营,至少有三件事可以做:一是盘点数据资产;二是建立计算能力;三是开放数据平台。按照贵州移动芈大伟总经理的思路,运营商大数据发展路径分为1.0、2.0和3.0三个版本。

大数据1.0主要针对运营商内部分析,建设重点以数据整合和能力构建为主,为数据价值发掘奠定基础,重点支撑精准营销和精确建网;大数据2.0主要针对数据价值提升,重点是逐步拓展对内对外数据价值挖掘的能力;大数据3.0主要针对数据变现,聚焦重点客户和行业,构建数据生态系统,逐步凸显外部收入。

目前,运营商在IT系统和网络系统上积累了很多数据资产(当然如果处置不当也可能会变成数据遗产……),通过SDN和NFV等IT技术重构的通信网络,将会形成全新的弹性、智能的网络架构。而网络IT化,就要求建立以云数据中心为核心的网络架构,数据中心将成为ICT基础设施的核心,数据中心的布局和规划决定未来网络的架构,也决定了未来的竞争力。

伴随20多年的互联网发展,掌握未来的“联接一代”和“数字元人”已经长成。相比上一代人,他们的沟通、交友、娱乐、消费、工作、学习等行为方式和思维模式,已经发生深刻的变化,他们对于数字社会和互联网的依赖与生俱来,代表着互联网时代的新消费行为。

运营商新的业务运营系统不再是简单的支持系统,更不是简单的营销界面在线化,而是连接运营商、客户和合作伙伴,连接网络、应用和内容的价值创造系统和生态链系统。传统的线下营业厅或将大幅减少甚至消失,取而代之的,是用户可以全在线模式按需、实时定制享受各项服务,运营商通过大数据分析洞察客户和精确营销,提供更加智能的客户服务。

从购买产品走向购买服务,商业世界的游戏规则正在发生根本上的变化,商家和用户之间的关系从交付那一刻才刚刚开始。

互联网之父劳伦斯·罗伯茨曾讲过:“自网络诞生以来,我们只实现了网速的提高,而在提升网络性能及其他方面毫无进步。”在这方面,运营商正在积极从消费体验出发打造新型的业务运营系统,新系统不再是简单的业支系统和网管系统,更不是简单的营销在线化,而是连接运营商、客户和合作伙伴,连接网络、应用和内容的价值创造系统。

第4篇

一、前言

近年来,大数据迅速发展成为工业界、学术界甚至世界各国政府高度关注的热点。在大数据时代,“数据即资产”的核心理念已成为各个行业的共识,大数据具有4V的特点:一是数据容量巨大(Volume),二是数据类型众多(Variety);三是数据价值密度低(Value);四是处理数据的速度要求非常快(Velocity)。相关研究预测标明,2015-2020年是大数据行业高速发展期,到2020年中国的大数据市场规模为454.33亿元,增长速度为20%。互联网行业、政府、金融、电信、零售等典型行业率先启动大数据产业布局,传统行业也积极收集行业数据,引入外部大数据,建设大数据平台,开展跨行业大数据创新应用实践,不仅使行业内部运行效率得到提升,加速传统行业转型升级,而且已经创造出巨大的经济价值和社会价值。2016年7月28日,《国家信息化发展战略纲要》,明确指出要促进工业经济向信息经济转型,大力推进数据资产化和资源化,优先开放政务和民生保障服务相关的数据,随着政策红利不断发放以及大数据共享机制的逐渐完善,毫无疑问,大数据将更加深刻地推动产业发展。

二、跨行业大数据应用场景和典型案例(图1)

电信行业通过将行业内部的B/O/M域数据、上网日志等和外部金融、旅游、政务等行业数据进行结合,已经实现了端到端网络分析优化、精准营销、用户体验提升、地理位置服务、智慧旅游、智慧城市、行业分析报告等场景应用。例如国内三大运营商基于上网日志分析和外部数据综合分析,解决用户上网流量投诉,提供行业指数,并与金融、公共服务、位置服务等在大数据应用进行合作。

金融保险行业整合个人特征数据、资产数据、保单数据等行业内部数据和互联网行为数据、地理位置信息、个人消费数据、征信数据等行业外部数据,形成基于大数据的客户洞察、互联网征信、投资预测、风险控制、极速放贷、电信诈骗拦截等创新应用场景。

医疗健康行业通过将个人体征数据、个人特征数据、基因检测数据、电子病历、遗传数据等医疗领域数据和互联网用户搜索数据、地理位置数据、气候数据、环境数据、人口流动数据等行业外数据融合和分析,可实现疾病预测、个人健康监测管理、癌症诊断和预测及早产儿病情诊断。

文化传媒行业通过将消费者数据库、影视基础数据、影视评分数据、用户视频播放行为数据、电视节目收看行椤⒕缂播放设备、剧集播放时间等行业数据与互联网搜索数据、社交网络数据、线上购物数据等进行融合,进行投资风险评估、受众定位、影视精准营销、票房预测。

旅游行业通过将个人特征数据、景区数据等行业内部数据与气候数据、地理位置数据、运营商移动用户数据等行业外数据结合,实现旅游指数、景区客源分析、个性化推荐、景区预警等。

能源行业作为典型的传统行业,也开始将行业内部的企业生产数据、勘探大数据、油气管道数据、风电场实时流体模型数据、光伏电站数据、气象数据、地理数据等和外部地理位置数据、环境数据、气候数据、风速数据、海拔数据、大气温度、日照数据、周边救援方案数据、地震数据、能源输送数据等进行结合,开展了自动化矿井值守、精准化油气开采、井位确定、安全监控和预警、油气管道腐蚀点预测、风电场自动化选址设计、风能发电量预测、光伏电站健康度检查、光伏电站精准运营等创新应用。

零售贸易行业通过运用大数据技术提高了生产数据的计算速度,还通过将销售数据、人力成本、物流数据等内部数据和突发事件、交通数据、气候数据等外部数据相结合,实现货品摆放营销设计、物流成本控制、销售数据分析、产品溯源等应用。

农林牧渔业通过将农业生产数据、养殖数据、质检数据、消费者评价数据、生产/设备监控数据、土壤数据、人力成本、物流数据、销售数据、农产品市场价格等内部数据和突发事件、交通数据、气象数据等外部数据相结合,实现可视化农场生产管理、农场耕作精细化管理、物流成本控制、肉类/乳品安全溯源体系、种植灌溉差异化、防灾预警等。

汽车行业通过内部汽车企业运营数据、汽车企业研发数据、汽车销售数据、车辆行驶状况数据、车联网传感数据、座椅压力数据、汽车配件数据等行业内部数据和互联网舆情数据、用户群体行为数据、实景地图数据等外部数据结合,实现产品人性化设计、无人驾驶、汽车网站用户导流、精准广告推送、汽车防盗、行驶安全预警。

化工行业通过将物流管理大数据、销售数据、人力成本数据、ERP系统数据、订货数据、加油站销售数据结合行业外部的气候数据、交通数据、网上支付数据、个人互联网用户行为、个人位置信息数据等,实现石脑油原料操作样本建模、石化产品结构优化、生产安全预警指挥、环境应急预警、客户识别、精准营销。

公共事业领域利用公共设施监测数据、维修记录、交通监测数据等进行公共设施危险预警和事故追踪;通过对患者数据、疾病数据和诊疗数据进行综合分析可帮助医院进行智能病症诊疗;公安部门基于交通信息、旅游数据、安防数据、地理位置、道路监控数据、用户真实信息等多方位数据结合,可以实现人流、车流的实时监控,以及异常人群聚集预警等。

此外,房地产、冶金、教育培训等领域也进行了非常多的行业大数据应用探索。可以看出,充分挖掘产业大数据的商业价值可大大促进产业服务质量和效能提升,加速传统行业的转型升级。

三、电信运营商跨行业合作方向建议

第5篇

大数据可能确实是一个网络行业热潮,但我们现在尚不清楚这项技术是否可以实现关键的信息到知识的过渡。所幸的是,网络管理员可以通过一些努力来穿过大数据炒作的喧嚣,把她当做改善网络运营的工具。

在网络中,大数据通常是指从标准管理系统和接口获取的大量流量、中继以及设备信息,这些数据是从部署在各个端点的探头以及从客户端及服务器设备中的网络层软件来收集。当这些数据放在标准管理系统接口框架中时,一些信息可能会反映出当前的故障、配置、结算、性能和安全(FCAPS)管理做法,但大多数公司不能将来自客户端/服务器设备的数据域当前的运营活动关联起来。而这正是大数据和大数据分析的“用武之地”。

有效利用网络大数据的最关键的因素是保证所有数据元素的精确事件定时。网络是关于事件的瞬间情况和并列,失去时间同步性意味着在分析信息时完全失去价值。如果所有数据收集都是从共同来源定时,就能够确保时间同步性。如果不是这样的话,你应该将同步化事件引入到大数据收集点,以在正则点关联所有记录的时间。

建立映射来查明网络问题

在保证事件的时间可以精确地关联后,下一步是在这个共同时间轴和网络问题之间建立映射。有关网络问题来源的信息可能出自当前的FCAPS过程、用户投诉或者客户端/服务器遥测。后者也可能有助于恢复体验信息质量,如响应时间,以及测量数据包丢包率和延迟性(例如从TCP窗口大小)的网络性能数据。这种映射允许大数据分析来探索这些问题点与问题第一次出现之前时的指标的关系。

这种类型的大数据分析能够帮助分析网络问题的根本原因,这往往是通过其他手段不可能做到的。由于网络环境变化非常迅速,管理员经常在追逐问题,从一个地方到另一个地方,然而,当问题发生时从来没能找到正确的原因。大数据分析可以将数千(或数百万)数据元素与已知问题点相关联,找出相关性,然后通过数据分析来找出根本原因。

确定正常运行情况

利用大数据解决网络问题的另一种策略是使用大数据得出正常网络环境的基本数据。如果上一步(映射问题点到大数据共同时间表)正确完成的话,我们将知道当没有任何问题时网络的情况。收集这些“运行良好”时期网络数据的分析将允许管理员确定什么是正常网络行为,并根据收集的数据量来量化这种“正常”。

然后,基线正常行为可以用来分析网络运营中不被视为问题的时段,但也不能完全确定是否是正常操作行为。经验丰富的网络管理员都知道,有时候网络会进入一种不稳定的状态,实际上并没有出现故障或者收到用户投诉。在网络、整体需求或者服务器资源状态中,也有这样的情况会影响网络运营。基线数据可以帮助找出造成这种状况的原因。

大数据分析可以帮助找到方法来修复网络环境

我们需要寻找这样一种行为,即分析表明网络环境未能生成问题报告时,甚至当它密切模仿一个问题时期。在这里,我们的目标是利用分析来探索是什么缓解了预期的问题;这可能改善你的根本原因分析或者提供其他方式来修复环境。

另一个需要检查的是资源如何受到网络事件、应用或服务器事件,或者用户流量负载的变化的影响。当这些方面发生显著变化时,网络应该以可预见的方式作出回应。例如,应用流量的显著变化通常会导致响应时间的明显增加,以及丢包率的上升等。

但如果这些行为发生时没有伴随流量的重大变化,则表明资源已经超载。同样,如果流量发生重大变化,而没有伴随响应时间或网络丢包的增加,也可能表明网络供大于求。在这种情况下,可以减少一些容量,从而帮助保护较低的运营预算。

只专注于可操作的情报

第6篇

【摘要】近年来,中国影视行业蓬勃发展,伴随着互联网技术革新,影视业正在与大数据举行一场盛大联姻,以实现交互式的影视制作。国内影视业日渐重视大数据的运用,《小时代》、《失恋33 天》等国产电影因此而获得成功的票房。本文从影视作品的创作、传播、接受环节探讨大数据分析的运用及其意义,以及未来影视大数据的发展趋势。

关键词 大数据 影视业 创作 运营

2013 年被称为影视界的“大数据元年”,运用大数据分析成功营销的影视作品使人们看到了大数据给影视行业带来的无穷潜力。在中国,影视大数据也越来越受到专业人士的重视。2014 年6 月23日,一档寻找电影天才的真人秀节目《全民电影》在吴宇森、章子怡和刘仪伟等明星助阵下拉开帷幕。在这个中国首档全媒体电影项目中,百度利用自身数据优势首次深度介入,对一部电影从选题、融资、组队等制作阶段开始,到发行再到播放的全流程,提供深度数据规划与策略支持。

一、大数据和影视行业

“大数据”一词最早出现在美国著名未来学家阿尔温·托夫勒的《第三次浪潮》一书,2011 年全球著名咨询公司麦肯锡研究所在其发表的报告《大数据:下一个创新、竞争和生产率的前沿》中指出,数据已经渗透到每一个行业和业务职能领域,逐渐成为重要的生产因素; 而人们对于海量数据的运用将预示着新一波生产率增长和消费者盈余浪潮的到来。①大数据是指所涉及的数据量规模巨大到无法通过人工在合理时间内达到截取、管理、处理、并整理成为人类所能解读的信息。②根据Philip Rossum 在《大数据分析》一书中指出的那样,大数据不仅仅指的是数据的大数量,还包括多种类和高速度,这三方面都是保证数据质量的关键要素,缺一不可。③

在传统意义上的影视行业中,影视作品是否能够受到广泛的欢迎,主要依赖的是创作者自身的专业水准,对受众心理的洞悉程度,以及选择演员的眼光等等。大数据的出现使得影视作品的传播方式由之前的单向传播转变为交互传播。影视大数据的数量大,可以从空间维度和时间维度上来分析。(见表1)

影视数据种类多是指影视大数据中包括的影视作品本身的创作信息、销售信息、观众的反馈信息等多个层次,但凡是与影视作品有关的,都囊括在影视数据库中。并且影视大数据的数据库范围也依据不同的分析目的而可大可小。按照戴志强等的分类,影视大数据主要可以分为三大类,即用户大数据、内容大数据和渠道大数据。④

二、大数据与影视创作

中国影视行业近年来飞速发展,以电影行业为代表:

上述表2 和图1 中可以看出,我国以电影为代表的影视行业近4 年正在蓬勃发展,不仅全国电影票房呈现良好的上涨态势,其中国产片票房占比也在持续升高。为此,国产片在创作过程中也在不断借助大数据的力量来制作出符合大众审美情趣的影视作品。由优酷土豆集团携手儒意影业、乐视影业制作的电影《老男孩之猛龙过江》,就是通过对粉丝的情感洞察和行为分析,来指导其内容创作,堪称开创了中国互联网电影的新模式。

在大数据指导下的互联网电影创造过程中,观众可以从被动的受众变为主动的影片制作参与者。以2014 年阿里巴巴推出的“娱乐宝”为例,网民出资100 元即可投资热门影视剧作品,通过投票来决定电影的制作人、导演、男主角、女主角等。首批登录娱乐宝界面的6 个项目—— 电影《小时代3》、《小时代4》、《狼图腾》、《非法操作》以及社交游戏《魔范学院》等,截止到4 月3 日已经全部售罄,共出售78.5 万份,总投资额达到7300 万元。受众能做的不再限于观影后的反馈和评价,而是能够从作品生产初期就提出自己的意见。

同时,受众不仅可以影响制作团队的构建,也可以改变剧情的发展。国外知名电视剧《纸牌屋》通过云计算确定下集剧情,国内虽然没有如此先进的大数据技术,但是通过大数据得到的用户评价确实能够改变编剧的心意。2014 年七夕档热播都市爱情电影《单身男女2》的结局之所以扭转,就是因为早在《单身男女1》上映后,许多观众不满于女主角做出的选择,纷纷留言表示惋惜,于是导演决定在第二部里让女主角再选择一次。

从影视制作方来看,大数据能够使制作方更了解观众的期待,“娱乐宝”则折射出了这些投资人的兴趣爱好,以此帮助电影实现观众的精确定位,包括影片类型、上映时段等。大数据不仅“ 大”而且更“细”,在影视创作阶段的大数据分析应当既包括对于用户历史数据的分析,如通过前期不同类型电影的票房分析、受众对不同题材影视的反馈分析等,又包括用户对电影的期许,如某类用户的特定需求、抛出目前电影创作计划得到的回应等。创作者可以找到与自己风格相契合的受众群体,或者可以使自己受益最大化的定位。

电影《小时代》的出品方乐视影业,根据网络上《小时代》的搜索量,分析了关注《小时代》的人群,最后描绘出《小时代》的目标受众,即“互联网的原住民”。这些90后大部分是郭敬明和杨幂等主创人员的忠实粉丝,也是当前电影市场的主流消费群体。(见图2)

总之,大数据可以提升国产电影的成功率,促进更有特色更高质量作品的生产,同时,大数据提供了一个绝佳的视野帮助国内的制作班底了解国外受众的品位。

三、大数据与影视传播

在中国影视市场,大数据的应用最主要集中于影视传播阶段,中国电影业迎来发展良机与大数据有密不可分的关系。《致青春》、《失恋33 天》、《北京遇上西雅图》、《中国合伙人》等的成功,都离不开大数据在背后的支持。(见图3)

大数据应用于影视作品传播的目的是为了改变以往不但不会提升传播效果反而可能引起反感的狂轰滥炸式统一传播。其传播方式如图4 所示。

目前普遍使用的一种高精准度宣传是利用社交媒体传播。以《小时代》为例,还在拍摄阶段时,原著作者兼导演郭敬明就通过个人微博向网友透露《小时代》的拍摄情况,在临近上映时,郭敬明的个人微博状态几乎全部和小时代有关,不仅如此,郭敬明还和《小时代》的主要演员在微博上互动宣传。采取郭敬明个人微博的宣传方式其实就是一种定向宣传,关注其微博的网友大多为郭敬明的读者粉丝或者对其一定程度感兴趣的人,这部分人很可能成为观众,或者上述分析中的前两者,因此也是宣传的主要对象。

但总体上来说,传播手段的选取要基于对特定用户的特性,在做好用户定位之后,就要利用大数据分析用户的媒介使用偏好或者其他与电影主题相关的特性,以此来定制传播方式。乐视通过分析还发现,《小时代》用户中,女性占到78%,男性占到22%,因此做了很多针对女性的线上线下的活动。⑥

由此看来,大数据强调“大”,但更要“准”,大数据虽然揭示的是群体的共性,但价值更在于细分群体,实现定制化服务。爱奇艺网站就在2013 年推出了“千人千面”的个性化首页,为不同的用户量身定做观看内容,增进用户体验。

四、大数据与影视接收

接收应该包括收受(或适应)和交流两个层面。⑦对于影视作品收受效果的分析不应该只是事后统计分析,更应该是事前分析市场和预测销售前景。由谷歌推出的电影票房预测模型,能够基于数据分析,通过分析电影相关的搜索量来预测电影最终的票房成绩,准确度可高达94%。⑧

同时,对于票房之类的单一指标,存在着难以全面衡量影视作品收受效果的问题。在大数据时代,用户在视频网站的观看记录连同用户的点击、搜索、暂停、跳转等观看行为和使用设备状况及用户的IP 地址等信息都会被程序捕捉到。这些细节可以很好地反映用户喜欢哪些情节,对哪段情节没有观看欲望等,这些方面,是没有办法从是否观看的票房指数中得出的,也是无法从对影片的整体评价中得出的,但是这些细节数据却对影视作品的改进更具有指导意义。另外一方面,用于更全面反映影视作品传播效果的综合指标也在不断更新中。比如2014 年4 月电影频道公布的电影大数据指数即“M 指数”,是以电影的影院、电视、新媒体三大主体市场平台海量信息为核心,运用大数据挖掘技术运算而成的综合指标。⑨又如优酷、土豆推出的“中国网络视频指数”,则是分析互联网平台上的视频综合效果,以娱乐综艺《快乐大本营》为例,“中国网络视频指数”显示了其播放指数、播放设备、播放网站、每一集分析、人群和地区分布等。(见图5)

现在,用户在观影后喜欢在社交媒体上分享自己对影视作品的看法,尤其是年轻的上网一族,这又为大数据分析发挥作用提供了新的源泉。通过词频分析、话题查找等方式,可以把分散在各大社交网站上的零碎感受整合起来,作为分析对象,了解用户的真实想法。值得注意的一点是,为了能够更好地得到用户的反馈,影视创作营销人员应该为受众开创一个反馈交流平台,比如说一个微博公共账号,或论坛贴吧等。用户之间可以形成交流观影感受的圈子,也可以及时向创作者反馈自己的看法。这样一方面,自身构建的数据库得以补充,另一方面,可以增加用户粘度。

所以说,大数据分析影视接收情况,不仅仅是为了了解本次影视作品的传播效果,更是为了了解用户习惯,增加用户忠诚度,为以后的系列片子或者其他相关作品累积经验,以收获更大的成功。

结语

大数据为我国影视行业的发展带来无穷潜力,通过在创作、传播、接收环节的数据分析,能够帮助影视行业实现更精准的用户定位和市场分析,以生产出内容优质、符合受众口味的高质量影视产品,同时能够提升用户服务使之贴合用户习惯。总之,大数据提高了国产电影的成功率,加强了生产者与用户之间的互动,有助于国产片早日走出国门。

参考文献

①⑧张璠,《影视业中“大数据”技术应用》[J]《. 信息技术与信息化》,2014(4):232-234

②Manyika J, Chui M, Brown B, et al.Big data: The next frontier for innovation,competition, and productivity[J]. 2011.

③Russom P. Big data analytics[J]. TDWIBest Practices Report, Fourth Quarter,2011

④戴志强、朱海澎、潘皓,《影视大数据: 影视互动体验与量化认知的根本》[J].《现代传播》,2014(9):126-129

⑤中国新闻出版网,《互联网电影新鲜“出炉”》,chinaxwcb.com/2014-01/16/content_284956.htm

⑥陈肃,《大数据,连接电影与观众的“网关”》,http://tech.qq.com/a/20131119/013653.htm

⑦李兴,《消费时代的作者、读者和文本——对接受美学的新思考》[J]《. 大众文艺》,2008(12)

第7篇

[摘 要] 大数据时代,需要更多的引擎支持,同时也创造了更多的应用。建立在分析数据集成数据的基础上,全面的运营检测信息系统不可或缺。通过对其理念、范围、应用进行探究,浅析其架构和用途。科技在不断进步,数据的集合更有无数种方式,同样面临更多的关卡,这需要全人类进行探索和启发,从问题中寻找新出路。

[关键词] 大数据;运营监测信息系统;应用

doi : 10 . 3969 / j . issn . 1673 - 0194 . 2017. 07. 081

[中图分类号] TP315 [文献标识码] A [文章编号] 1673 - 0194(2017)07- 0184- 02

0 前 言

大数据时代,我们需要更多的引擎支持,同时也创造了更多的应用。建立在分析数据集成数据的基础上,全面的运营检测信息系统不可或缺。

1 应用理念

运营检测信息系统,是利用了整个服务中心的数据,同时对监测中心进行调度,在各业务信息系统的支持、辅助、决策和展示下,建立起成果。它能够及时全面地反映公司整体经济的运作情况,宏观掌控布局,推动整个单位公司的走向。它将企业管理模式由自转转向公转、由壁垒转向协同、由分散转向集中、由自发转向可控、由孤岛转向共享,从而实现纵横贯通、双向协同、权责明确、流程清晰、管理高效的“五强”体系格局,建立了更坚固的保障墙。

同时,海量的大数据历史库存,是一笔无形的宝藏。企业可以对其进行数据建模,通过分析分类,更加全面地发挥运营检测信息系统的功能,提高其预警力和分析力,为业务创新创造新途径。

2 应用范围

大数分析下的信息支撑系统的应用,是现代化技术的优秀产物,也是人类进化的骄傲作品。我们可以将它推广至各大企业公司,推进他们的变革创新,实现资源整合共享,提升其运营水平和速度,实现对规划、建设、运营、检修、营销、人力、物力和财力的全面规模化评估。

同时,大数据能够实现对预算和收支的合理调控、电力购销的把控、资产全寿命周期的预估。甚至可以将产业发展和金融领域进行流程监测性分析,构建出集全面监测、运营分析、协调控制、全景展示和指示预警于一身的综合性系统平台。而且,在当前的市场和技术掌握下,我国已经实现了部分的自主化和科技化,将推动他们步入更多的企业,进行市场性的贯通。

3 应用概述

3.1 工作台系统

工作台是对数据进行操作的系统平台,通过对大数据按照应用指标、分时段和维度进行重新构造,并在终端显示应用。工作台系统在日常中进行检测和调控,配合系统的综合管理,对企业经营进行24小时在线实时监控分析。同时,通过工作台系统,可围绕核心业务活动与资源,对10年内的业务数据进行定向分析,通过构建监测模型、采用一定的指数体系和指定的阈值,将外部运营环境状况与核心资源综合绩效进行综合,在24小时在线的业务流程动态值下,可以实现对运营过程中设定的异动警报和预警处理。

3.2 数据库

检测数据库是建立在总部以及各大分部的两级数据中心资源上的,我们需要足够的支撑区检测分析和展示。在此台面上,将运营检测中心的指标体系进行整合,实现两级数据的整合,使得工作配合更加完善。

理想状态中,数据中心应该分为两类,结构化与非结构化数据库,将整个相关数据系统内同步至数据库中心,可以再数据库完成建模分析工作,同时通过ETL工具进行指定数据的抽取和验证,将指标合理展现。

3.3 大屏展示

大屏的展示是系统的输出端口,它包括展示类和检测类,将通过灵活可调控的方式定位展示场景,多方位多角度地进行全面无缝隙检测,使得运营分析和全景展示更加和谐。

3.3.1 全景可视

全景展示下,我们可以创建概念主题库,按照数据库的构建,快速纵览企业概况,综合化地展示其经营成果,体现其协调的管理水平。并通过多维展示发展成果,总结服务成效的进步,将整个热点设计聚焦于一体,目标性地展示公司运营的业绩成绩和管理成效,形成企业完善的形象。

3.3.2 全面监测

企业有自己独立而富含特色的运营模型,运营检测中心对公司的各大版块进行了在线检测控制,实现了外部环境、综合绩效、核心资源、运营状况和关键流程的一体化,将“全天候、全方位、全流程”的核心展示出来。大数据下的分析进度,一般是对当天检测的报道,经过分析比照,报告的内容得以支持,并运用于业务推进,为企业领导的决策增加了准确有力的数据支持,实现了高层的进一步高效化、

3.4 资源管理器

管理工具是系统检测运行的重要零件和引擎支持,因为高质量的数据管理、运作合成,都需要工具的精准和合理化,这样才能提供合理有效的数据分析。随着智能网络的发展建设,基于数据中心的企业级数据资源管理工具,将进一步对其数据库进行深入和管控。从保护核心资产安全和权威性权限来说,这样的高级管家是一个整体团队运行所不可缺少的灵魂角色,并且更有利于巩固现有的成果。

4 应用关键

基于大数据分析的运营检测信息系统,关键性在于将各大业务线进行汇总。在完整而准确的数据库中,充分集成分析,通过先进的预设数据管理工具,结合业务本身的指标和指令,建立相应的数据分析模型,并进行高校的历史记录化的数据分析,从而实现智能化报告支持,解决了人力所不能完成的分析,帮助高层及时决策调整。

4.1 科学高效的业务能力

当前先进的数据库管理工具有ETL和OGG,在其全面梳理公司环节的同时,通过对其要素的相关性进行检测,提取各大要素模型化并结构化。最后,在ETL的自动抽取技术和OGG的数据同步技术下,实现最有效的企业检测业务架构管理,将各大要素整合,全面推进数据分析的应用水准和管理水平。

4.2 统筹治理与分析

数据中心是数据的储藏室,本身并没有计算能力,需要将他们进行统筹才可以创造价值。因此,有序的管理和数据治理,是需要完善和加强的步骤,只有这样,集成数据库的业务数据才能更加完整和准确。

4.3 系统集成的闭环流程

数据的汇总离不开各大来源的高度集成,这样才能实现数据的实时性、共享性、和协同性,才能不“辜负”系统的高度进化。所以,需要主动推进业务融合,保持数据唯一性和新鲜度,充分提高他的标准度和稳定性,坚持ESB等企业服务总线技术,将数据交换的枢纽更加统一,维护好集成架构,规范化企业体系,实现完整的闭环流程管理模式。

5 结 语

数据时代,科技在不断进步,数据的集合更有无数种方式,同样面临更多的关卡,这需要全人类进行探索和启发,从问题中寻找新出路。

主要参考文献