近几年来,人工智能逐渐火热起来,特别是和大数据一起结合使用。人工智能的主要场景又包括图像能力、语音能力、自然语言处理能力和用户画像能力等等。这些场景我们都需要处理海量的数据,处理完的数据一般都需要存储起来,这些数据的特点主要有如下几点:
大:数据量越大,对我们后面建模越会有好处;
稀疏:每行数据可能拥有不同的属性,比如用户画像数据,每个人拥有属性相差很大,可能用户A拥有这个属性,但是用户B没有这个属性;那么我们希望存储的系统能够处理这种情况,没有的属性在底层不占用空间,这样可以节约大量的空间使用;
列动态变化:每行数据拥有的列数是不一样的。
【OSS】 …
Nov
27
2018
Oct
23
2018
Sep
11
2018
Sep
04
2018
Jul
25
2018
Apr
12
2018
Mar
26
2018
Mar
21
2018
Nov
16
2017
Nov
16
2017