291294878

Hive和数据库的区别?

1、数据库可以用在Online的应用中,Hive主要进行离线的大数据分析; 2、数据库的查询语句为SQL,Hive的查询语句为HQL; 3、数据库数据存储在LocalFS,Hive的数据存储在HDFS; 4、Hive执行MapReduce,MySQL执行Executor; 5、Hive没有索引; 6、Hive延迟性高; 7、Hive可扩展性高; 8、Hive数据规模大;

291294878

2018-10-16

121.9935 4 1
  • 关注作者
  • 收藏

怎样实现数据的归一化和标准化?

严谨来说,归一化只是标准化的一种方式,最常见的是以下两种: 1、min-max标准化(Min-max normalization) x*=(x-min)/(max-min) 可映射到[0,1],若为了映射到[-1,1],则在此基础上2x*-1 注:这种方法有一个缺陷就是当有新数据加入时,可能导致max和min的变化,需要重新定义。 2、z-score标准化(zero-mean normali

291294878

2018-10-16

230.1389 9 1
  • 关注作者
  • 收藏
<18910