如何使小数变为整数?
小数定标规范化公式方法如下:
数据规范化的几种方法
1、Min-Max规范化
Min-Max规范化是将原始数据变换到[0,1]的空间中。公式:新数值=(原数值-极小值)/(极大值-极小值)。
2、Z-score规范化
假设A与B的考试成绩都为80分,A的考卷满分是100分(及格60分),B的考卷满分是500分(及格300分)。虽然两个人都考了80分,但是A的80分与B的80分代表完全不同的含义。那么如何用相同的标准来比较A与B的成绩呢?Z-Score就是用来解决这一类问题的。公式:新数值 = (原数值-均值)/标准差。
假设A所在班级平均分为80分,标准差为10。B所在班级平均分为400,标准差为100。那么A的新数值=(80-80)/10=0,B的新数值=(80-400)/100=-3.2。
所以在Z-Score标准下,A的成绩会比B的成绩好。我们能看到Z-Score的优点是算法简单,不受数据量级影响,结果易于比较。局限在于,它需要数据整体的平均值和方差,而且结果没有实际意义,只是用于比较。
3、小数定标规范化
小数定标规范化就是通过移动小数点的位置来进行规范化。小数点移动多少位取决于属性A的取值中的最大绝对值。
举个例子,比如属性A的取值范围是-999到88,那么最大绝对值为999,小数点就会移动3为,即新数值=原数值/1000。那么A的取值范围就被规范为-0.999到0.088。
数据变换的四种常见方法
1、数据平滑
去除数据噪声,将连续数据离散化。主要是用分箱、聚类和回归方式等算法进行数据平滑。
2、数据聚集
对数据进行汇总,SQL中有一些聚集函数可以供我们操作,比如Max反馈某个字段的数值最大值,Sum返回某个字段的数值总和。
3、数据概化
将数据由较低的概念抽象成为较高的概念,减少数据复杂度,即用更高的概念替代更低的概念。比如说上海、杭州、深圳、北京可以概化为中国。
4、数据规范化
使属性数据按比例缩放,这样就将原来的数值映射到一个新的特定区域中。常用方法有min-max规范化、Z-score规范化、按小数定标规范化等。