近几年来,人工智能逐渐火热起来,特别是和大数据一起结合使用。人工智能的主要场景又包括图像能力、语音能力、自然语言处理能力和用户画像能力等等。这些场景我们都需要处理海量的数据,处理完的数据一般都需要存储起来,这些数据的特点主要有如下几点:
大:数据量越大,对我们后面建模越会有好处;
稀疏:每行数据可能拥有不同的属性,比如用户画像数据,每个人拥有属性相差很大,可能用户A拥有这个属性,但是用户B没有这个属性;那么我们希望存储的系统能够处理这种情况,没有的属性在底层不占用空间,这样可以节约大量的空间使用;
列动态变化:每行数据拥有的列数是不一样的。
【OSS】 …
Nov
27
2018
Nov
05
2018
Nov
05
2018
Oct
09
2018
MySQL 启动报错信息如下: Starting mysqld (via systemctl): Job for
mysqld.service failed because the control process exited with
error code. See "systemctl status mysqld.service" and "journalctl
-xe" for details、 [FAILED] 根据提示,使用 systemctl status
mysqld.service 和 journalctl -xe 查看服务启动失败的原因。
【mysql】 【code】 【spark】 【Server】 【Create】 【session】 …
Sep
11
2018
Aug
17
2018
Aug
15
2018
Jun
25
2018
Apr
11
2018
Jan
04
2018