-
10亿+ 秒 看阿里如何达成实时数仓高吞吐实时写入与更新
所属栏目:[大数据] 日期:2022-09-05 热度:113
数据实时入仓所面临的挑战:高性能、可更新、大规模 大数据场景下,实时数据如何写入实时数仓永远是一个比较大的话题,根据业务场景需求,常见的写入类型有: Append only:传统日志类数据(日志、埋点等)中,记录(Record)和记录之间没有关联性,因此新来[详细]
-
善用企业数据策略 无惧混合云和多云环境挑战
所属栏目:[大数据] 日期:2022-09-05 热度:71
混合云和多云架构具有高度的可控性、易扩展性和成本效益,因此企业可以自由选择独立的云产品,以满足几乎任何业务需求。员工可以通过混合云轻松分享和访问数据,推动发展以数据驱动的文化并帮助企业更快地获得洞察。通过混合数据平台,企业能够访问和分析位[详细]
-
Python 取得旅游景点信息及评论并作词云 数据可视化
所属栏目:[大数据] 日期:2022-09-05 热度:98
今天将手把手教你使用线程池爬取同程旅行的景点信息及评论数据并做词云、数据可视化!!!带你了解各个城市的游玩景点信息。 首先新建一个线程并开启线程后线程进入就绪状态,就绪状态的线程不会马上运行,要获得CPU资源才会进入运行状态,在进入运行状态后[详细]
-
万字详解大数据平台异地多机房架构践行
所属栏目:[大数据] 日期:2022-09-05 热度:150
随着B站业务的高速发展,业务数据的生产速度变得越来越快,离线集群规模快速膨胀,既有机房内的机位急剧消耗,在可预见的不久的将来会达到机房容量上限,阻塞业务的发展。因此,如何解决单机房容量瓶颈成为了我们亟待解决的问题。 目前,针对机房容量问题的[详细]
-
抽丝剥茧 深入的数据分析咋整
所属栏目:[大数据] 日期:2022-09-05 热度:139
很多同学总觉数据分析做得不深入,到底该怎么做?今天结合一个具体的例子,分享下如何做一个深入的数据分析项目。 深入级别:0级 某天,你收到一个需求:看下我司APP新增的A功能,过去5天内累计使用1+次的人有多少(去重)。这问题太简单了,直接跑个数丢过[详细]
-
如何使用大数据驱动业务增长
所属栏目:[大数据] 日期:2022-09-05 热度:85
大数据在商业中的作用日趋凸显,数据驱动已经成为企业发展的核心竞争力。 在领导的推动下,很快成立了跨部门的融合增长团队,下面和大家分享这段融合团队的工作经历,一同洞察数据在业务增长方面的实践。 一.切入点 当时融合团队的切入点选得很不错,增加贷[详细]
-
使用 FlatBuffers 提高反序列化性能
所属栏目:[大数据] 日期:2022-08-25 热度:134
最近一直在寻找一个性能和资源占用兼具的序列化和反序列化工具,大多组织都是采用的 JSON, JSON 可以做到数据的前后兼容,并且更容易让人理解和可视化,但 JSON 的性能相对更差,自身的元数据也会占用更多的存储空间。 根据官网介绍FlatBuffers是一个高效的[详细]
-
区块链影响数据分析行业的五种方式
所属栏目:[大数据] 日期:2022-08-25 热度:146
新技术的出现比人们想象的还要快。像大数据和区块链这样的新兴技术正在成为传统。此类技术正在改变企业开展业务的方式。例如这两种技术是独立的,并且是独立使用的。然而,虽然数据科学处理的是从原始和非结构化数据中寻找见解,但区块链技术是一个共享的账[详细]
-
开发大数据应用程序企业的四个成功要素
所属栏目:[大数据] 日期:2022-08-25 热度:178
大数据技术正在以无数种方式改变我们的生活。由于数据提供的许多好处,越来越多的公司正在对其进行投资。到2026年,全球公司预计将花费超过2340亿美元。这对于为客户和企业等开发大数据应用程序的公司来说是一个绝佳的机会。 如果您有兴趣创建一个成功的大数[详细]
-
成功进行数据迁移的策略
所属栏目:[大数据] 日期:2022-08-25 热度:111
数据迁移是一个复杂且通常成本高昂的过程。企业将需要正确的方法来准确无误地迁移数据,其中包括深思熟虑的策略和适当的工具。 什么是数据迁移? 数据迁移是指将数据从一个存储系统传输到另一个存储系统的过程。它从数据选择和准备开始,在此期间进行提取和[详细]
-
大数据时代,是谁在监视着我们?
所属栏目:[大数据] 日期:2022-08-25 热度:138
你知道吗,有人比你更加了解你自己。 做人脸识别的公司知道我们每天晚上什么睡觉,周末早上赖床到几点。 周一早高峰时间挤在地铁里刷财经新闻的人,会在周五下班路上收到系统推送的八卦新闻。 你跟家人朋友随口一句吐槽,打开淘宝就能看到相关商品的推荐。[详细]
-
大数据在本质上不是一种技术而是一种思维方式
所属栏目:[大数据] 日期:2022-08-25 热度:192
我常说,互联网并不可怕,仅仅只是一个渠道罢了,并不会生产出什么特定的价值,他只是一个渠道的扩充,只是这个渠道是指数成长罢了。 大数据在本质上不是一种技术而是一种思维方式,也仅仅只是一个渠道罢了。 比如我们通过数据可以得知很多的事情,看上去是[详细]
-
数据团队来管理数据的年代该结束了
所属栏目:[大数据] 日期:2022-08-25 热度:149
最初使用的是数据仓库,然后是数据湖。如果大肆宣传是可信的话,那么现在是数据网格的时代了。 所有这些都依次被视为开启金融数据真正价值的灵丹妙药。那么,为什么数据的真正价值之前没有实现呢? 中心化的数据团队常常会在公司结构中造成瓶颈,阻碍整个企业[详细]
-
论物联网与大数据、云计算、工业物联网
所属栏目:[大数据] 日期:2022-08-25 热度:189
我们当今的时代飞速发展,物联网、大数据、云计算这些名词在我们的生活中出现的越来越频繁,看似高大上的三者其实却和我们的生活息息相关。本篇文章就物联网、大数据以及云计算对三者之间的关系以及应用进行描述。工业物联网也进行了介绍。 一、物联网 1、什[详细]
-
如何使用Google Cloud Data Studio进行数据分析
所属栏目:[大数据] 日期:2022-08-25 热度:169
介绍 Google Cloud Data Studio是一种将数据转换为有用的报告和数据仪表板的工具。截至目前,GoogleData Studio拥有22个内置的Google连接器和571个不同的合作伙伴连接器,它们有助于连接来自BigQuery、Google Ads、Google Sheets、Cloud Spanner、Facebook A[详细]
-
利用大数据创新思想政治状况分析方法
所属栏目:[大数据] 日期:2022-08-25 热度:159
随着大数据技术的普及,我国正不断推动大数据战略目标的实施,相关技术也日渐成熟,数字中国和智慧中国的构建正稳步推进。大数据可以对信息进行全新的分析。通过一切事物皆可量化的大数据技术优势,深入发掘和扩展数据的深度和广度,推进与传统定量、定性分[详细]
-
Flink CDC + Hudi 海量数据入湖在顺丰的实践
所属栏目:[大数据] 日期:2022-08-25 热度:193
一、顺丰数据集成背景 顺丰是快递物流服务提供商,主营业务包含了时效快递、经济快递、同城配送以及冷链运输等。 运输流程背后需要一系列系统的支持,比如订单管理系统、智慧物业系统、以及很多中转[详细]
-
为什么云原生数据湖值得重视?
所属栏目:[大数据] 日期:2022-08-25 热度:64
最近几年,数据湖正在被越来越多人提起,尽管各方对数据湖的定义并不统一,但这不妨碍企业纷纷下水实践,比如亚马逊、阿里、腾讯、华为等,都在探索建设数据湖。为何众多企业在数据湖是什么上还没有达成共识的情况下,就开始着手进军数据湖领域呢?一个可能[详细]
-
终于有人把Hadoop大数据系统架构讲清楚了
所属栏目:[大数据] 日期:2022-08-24 热度:159
传统的系统已无法处理结构多变的大数据,而高性能硬件和专用服务器价格昂贵且不灵活,Hadoop因此应运而生。Hadoop使用互连的廉价商业硬件,通过数百甚至数千个低成本服务器协同工作,可有效存储和处理大量数据。 1.Hadoop生态体系 Google通过三篇重量级论文[详细]
-
交通领域的物联网如何使大数据之于企业产生价值
所属栏目:[大数据] 日期:2022-08-24 热度:140
全球物流市场不断增长,科技正成为发展的主要触发器。 企业正在寻找用于运输的物联网解决方案,以帮助他们提高供应链的可见性、改善物流各个阶段的运营并节省资源。 这可以通过使用物联网设备收集有关物流过程的数据并将其转换为有价值的业务信息来实现。 让[详细]
-
怎样用好数据科学
所属栏目:[大数据] 日期:2022-08-24 热度:53
很长一段时间以来,数据科学一直被视为科技和商业领域的下一次重大革命。最近几年增加了不少使用数据科学应用的企业。根据Statista的数据,截至2021年,近60%的公司在其团队中拥有至少50名数据科学家。 然而,如果客观地看待,数据科学提供的结果与它的期望[详细]
-
浅析大数据的数据灾备建设
所属栏目:[大数据] 日期:2022-08-24 热度:197
大数据时代,数据呈爆炸趋势增长,很多企业都从大数据中获得了利益,推动各自的业务上升了一个台阶。通过大数据技术的完善尤其是大数据和云容器技术相结合,各个企业已经把自己的重要业务迁移到了大数据平台。与此同时企业对数据可靠性和业务连续性保证的诉[详细]
-
未来已来 Cloudera拥抱混合数据年代
所属栏目:[大数据] 日期:2022-08-24 热度:171
我们生活在一个混合数据的世界中。在过去十年间,世界创建、捕获、复制和使用的结构化数据量已从2011年的不到 1ZB 增长到 2020 年的近 14ZB,这已经很惊人了,但还有另外更巨大的 50ZB数据非结构化数据、云数据和机器数据。 对于Cloudera来说,这是一个回到[详细]
-
如何策划数据可视化平台
所属栏目:[大数据] 日期:2022-08-24 热度:169
最近在项目上常常听到这样的话:我想要一个酷炫的数据大屏,设计一定要有科技感,这个可视化设计没有重点每当听到这些需求,作为设计师一般都是欲哭无泪的。到底什么叫酷炫有科技感?客户理解的数据大屏什么样?是数据还是可视化出了问题?? 这篇文章将会结[详细]
-
Python实行数据可视化 你会用什么库来做呢
所属栏目:[大数据] 日期:2022-08-24 热度:62
用Python进行数据可视化你会用什么库来做呢? 今天就来和大家分享Python数据可视化库中的一员猛将Altair! 借助Altair,我们可以将更多的精力和时间放在理解数据本身及数据意义上,从复杂的数据可视化过程中解脱出来。 简单来说,Altair是一种可视化语法,也[详细]
