表示 进入内容 2127
« 先前的 10 新的记录
Displaying posts with tag: 数据处理 (reset)
小白学数据 | 28张小抄表大放送:Python,R,大数据,机器学习

1. Python的数据科学快速入门指南

如果你刚入门Python,那么这张小抄表非常适合你。查看这份小抄表,你将获得循序渐进学习Python的指导。它提供了Python学习的必备包和一些有用的学习技巧等资源。

【python】  【大数据】  【算法】  【数据可视化】  【mysql】  【函数】  【SQL】   …

[获取更多]
Linux集群和自动化维1.5.1 服务器物理硬件的优化

1.5.1 服务器物理硬件的优化

 在对MySQL服务器进行硬件挑选时,应该从下面几个方面着重对MySQL服务器的硬件配置进行优化,也就是说将项目中的资金着重投入到如下几处: 磁盘寻道能力(磁盘I/O)。

【linux】  【服务器】  【mysql】  【性能】  【数据处理】  【数据库】  【集群】   …

[获取更多]
怎样在初创公司里搭建稳定、可访问的数据基础架构

数据是创立Asana的核心部分,并且每一个团队都依赖他们自己的方式。我们的负责增长的团队依靠事件数据来分析试验结果(对比试验)。 我们做很多快速的实验--通常会有很多实验一起跑-- 让这些互相影响的作用和其他关键度量引导我们需要放弃什么和投入什么 项目经理,设计师和产品工程师通过分析使用数据来发现不可避免的妥协,比如简洁性对强大性。

【架构】  【监控】  【mysql】  【性能】  【日志】   …

[获取更多]
创业公司如何做数据分析(六)数据仓库的建设

作为系列文章的第六篇,本文将重点探讨数据处理层中数据仓库的建设。如何建设一个适于分析的数据存储系统,该系统的工作应该包含两部分:第一,根据需求抽象出数据模型;第二,按照数据模型的定义,从各个数据源抽取数据,进行清洗、处理后存储下来。 中间数据流失,计算结果没有共享。

【python】  【mysql】  【数据处理】  【创业】  【数据仓库】   …

[获取更多]
应运而生! 双11当天处理数据5PB—HiStore助力打造全球最大列存储数据库

阿里巴巴电商平台历史数据存储与查询相关业务, 大量采用基于列存储技术的HiStore数据库,双11当天HiStore引擎处理数据记录超过6万亿条、原始存储数据量超过5PB。从单日数据处理量上看,该系统已成为全球最大列存储数据库。

【算法】  【mysql】  【性能】  【数据处理】  【高可用】  【数据库】   …

[获取更多]
三:基于Storm的实时处理大数据的平台架构设计

一:元数据管理器==>元数据管理器是系统平台的“大脑”,在任务调度中有着重要的作用【1】什么是元数据?--->中介数据,用于描述数据属性的数据。--->具体类型:描述数据结构,数据的具体位置,数据间的依赖关系,数据的处理过程,数据的快照信息等。

【分布式】  【大数据】  【架构】  【storm】  【mysql】  【系统监控】   …

[获取更多]
mysql小技巧积累(持续更新)

一、关于NULL值

1.update null值时,格式为set col=null,不能是is null,不能是'null'。2.mysql中,Null值不等于'',oracle中,空字符串会被当成null保存。

【mysql】  【线程】  【数据处理】  【lock】  【索引】  【空格】  【Transaction】   …

[获取更多]
表示 进入内容 2127
« 先前的 10 新的记录