sql产生随机数问题,带几率的
我想用纯sql实现带几率的随机数,请教如何实现?比如我只想产生0-100之间的整数0102030~100这样其中80%几率会产生0,20%几率产生10……1%几率产生10...
我想用纯sql实现带几率的随机数,请教如何实现?
比如
我只想产生0-100之间的整数 0 10 20 30~100这样
其中 80%几率会产生0,20%几率产生10 ……1%几率产生100
请问该如何实现?最好给出可运行的sql代码,万分感谢。
请直接给出答案,采纳追50 不差分 呵呵 展开
比如
我只想产生0-100之间的整数 0 10 20 30~100这样
其中 80%几率会产生0,20%几率产生10 ……1%几率产生100
请问该如何实现?最好给出可运行的sql代码,万分感谢。
请直接给出答案,采纳追50 不差分 呵呵 展开
4个回答
展开全部
1. 如何生成8位随机数,生成的数越随机,重复的可能性当然越小
2. 控制不重复
3. 考虑性能
针对这个问题,我写了如下的示例来解决,希望能为有这类需求的人提供指导
生成100万条8位不重复数据的示例
USE tempdb
GO
-- 创建测试表
CREATE TABLE tb(id char(8))
-- 创建用于自动过滤重复值的唯一索引
CREATE UNIQUE INDEX IX_tb ON tb(id)
WITH IGNORE_DUP_KEY
GO
-- 测试数据插入的处理时间, 记录开始处理的时间点
DECLARE @dt datetime
SET @dt = GETDATE()
-- 插入随机数据
SET NOCOUNT ON
DECLARE @row int
SET @row = 1000000 -- 设置总记录数
WHILE @row >0
BEGIN
-- 显示提示信息, 表示还需要插入多行数据
RAISERROR('need %d rows', 10, 1, @row) WITH NOWAIT
-- 插入随机的位编码数据
SET ROWCOUNT @row
INSERT tb SELECT
id = RIGHT(100000000 + CONVERT(bigint, ABS(CHECKSUM(NEWID()))), 8)
FROM syscolumns c1, syscolumns c2
SET @row = @row - @@ROWCOUNT
END
-- 显示插入数据使用的时间
SELECT BeginDate = @dt, EndDate = GETDATE(),
Second = DATEDIFF(Second, @dt, GETDATE()),
GO
-- 显示最终的结果记录是否正确
SELECT COUNT(*) FROM tb
GO
-- 删除测试
DROP TABLE tb
解决中用到的技巧:
1. 控制产生的数据不重复,直接使用唯一索引中的 IGNORE_DUP_KEY 选项,使插入数据中的重复值自动过滤,避免手工处理重复
2. 使用 CHECKSUM 配合 NEWID() 函数,使生成的数据尽量随机,一般生成随机数会考虑使用 RAND() 函数,但这个函数是产生伪随机值,用下面的语句测试一下,会发现产生的数据全部是一样的,这不适用于想批量生成多个随机数,而NEWID() 函数生成的是GUID,基本上不会有重复的,再通过CHECKSUM将其转化成数字,这样产生重复的可能性会比较小
SELECT TOP 10
RAND()
FROM sysobjects
3. 在效率控制,使用循环+批量生成的方式,而不是传统的逐个生成。在SQL Server中,每个插入语句都会有一个内部的事务处理,如果逐条插入,则事务的开销太大,效率势必非常低;不考虑一次性生成100万数据,一则因为生成的数据可能有重复的,去掉重复就没有100万了,二则一次性生成100万数据,消耗的内存和CPU资源也很高,一般的电脑可能承受不住
2. 控制不重复
3. 考虑性能
针对这个问题,我写了如下的示例来解决,希望能为有这类需求的人提供指导
生成100万条8位不重复数据的示例
USE tempdb
GO
-- 创建测试表
CREATE TABLE tb(id char(8))
-- 创建用于自动过滤重复值的唯一索引
CREATE UNIQUE INDEX IX_tb ON tb(id)
WITH IGNORE_DUP_KEY
GO
-- 测试数据插入的处理时间, 记录开始处理的时间点
DECLARE @dt datetime
SET @dt = GETDATE()
-- 插入随机数据
SET NOCOUNT ON
DECLARE @row int
SET @row = 1000000 -- 设置总记录数
WHILE @row >0
BEGIN
-- 显示提示信息, 表示还需要插入多行数据
RAISERROR('need %d rows', 10, 1, @row) WITH NOWAIT
-- 插入随机的位编码数据
SET ROWCOUNT @row
INSERT tb SELECT
id = RIGHT(100000000 + CONVERT(bigint, ABS(CHECKSUM(NEWID()))), 8)
FROM syscolumns c1, syscolumns c2
SET @row = @row - @@ROWCOUNT
END
-- 显示插入数据使用的时间
SELECT BeginDate = @dt, EndDate = GETDATE(),
Second = DATEDIFF(Second, @dt, GETDATE()),
GO
-- 显示最终的结果记录是否正确
SELECT COUNT(*) FROM tb
GO
-- 删除测试
DROP TABLE tb
解决中用到的技巧:
1. 控制产生的数据不重复,直接使用唯一索引中的 IGNORE_DUP_KEY 选项,使插入数据中的重复值自动过滤,避免手工处理重复
2. 使用 CHECKSUM 配合 NEWID() 函数,使生成的数据尽量随机,一般生成随机数会考虑使用 RAND() 函数,但这个函数是产生伪随机值,用下面的语句测试一下,会发现产生的数据全部是一样的,这不适用于想批量生成多个随机数,而NEWID() 函数生成的是GUID,基本上不会有重复的,再通过CHECKSUM将其转化成数字,这样产生重复的可能性会比较小
SELECT TOP 10
RAND()
FROM sysobjects
3. 在效率控制,使用循环+批量生成的方式,而不是传统的逐个生成。在SQL Server中,每个插入语句都会有一个内部的事务处理,如果逐条插入,则事务的开销太大,效率势必非常低;不考虑一次性生成100万数据,一则因为生成的数据可能有重复的,去掉重复就没有100万了,二则一次性生成100万数据,消耗的内存和CPU资源也很高,一般的电脑可能承受不住
追问
貌似不是我要的。留下继续,采纳追分,不差分呵呵
展开全部
直接运行就可以了,插入1000行,基本上可以看到100分在10个左右,10分的190个左右,其它为0
DECLARE @tmp TABLE(ID INT, Val INT);
DECLARE @ID INT;
SET @ID = 0
DECLARE @Rand FLOAT;
DECLARE @Val INT
WHILE(@ID<1000)
BEGIN
SET @Rand = RAND()*100; -- RAND()返回值在0到1之间,乘以100 变成0到100之间。
IF @Rand < 80 SET @Val=0; -- 80% 情况
ELSE IF @Rand < 99 SET @Val=10; --19% 情况
ELSE SET @Val= 100; -- 其余1%情况
INSERT INTO @tmp VALUES(@ID,@Val); -- 插入到你需要的表里,这里是插入@tmp
SET @ID= @ID+1
END
SELECT COUNT(*), Val
FROM @tmp
GROUP BY Val
GO
另一种写法,先定义一个 Scalar-valued function, 然后用这个function 插入。
IF EXISTS (SELECT * FROM sys.objects WHERE object_id = OBJECT_ID(N'[dbo].[fn_GetRand]') AND type in (N'FN', N'IF', N'TF', N'FS', N'FT'))
DROP FUNCTION [dbo].[fn_GetRand]
GO
CREATE FUNCTION [dbo].[fn_GetRand]
(
@Rand FLOAT
)
RETURNS int
AS
BEGIN
DECLARE @Val INT
SET @Rand = @Rand*100;
IF @Rand < 80 SET @Val=0; -- 80% 情况
ELSE IF @Rand < 99 SET @Val=10; --19% 情况
ELSE SET @Val= 100; -- 1%情况
RETURN @Val
END
GO
DECLARE @tmp TABLE(ID INT, Val INT);
DECLARE @ID INT;
SET @ID = 0
WHILE(@ID<1000)
BEGIN
INSERT INTO @tmp VALUES(@ID,dbo.fn_GetRand(RAND())); -- 插入到你需要的表里,这里是插入@tmp
SET @ID= @ID+1
END
SELECT COUNT(*), Val
FROM @tmp
GROUP BY Val
DECLARE @tmp TABLE(ID INT, Val INT);
DECLARE @ID INT;
SET @ID = 0
DECLARE @Rand FLOAT;
DECLARE @Val INT
WHILE(@ID<1000)
BEGIN
SET @Rand = RAND()*100; -- RAND()返回值在0到1之间,乘以100 变成0到100之间。
IF @Rand < 80 SET @Val=0; -- 80% 情况
ELSE IF @Rand < 99 SET @Val=10; --19% 情况
ELSE SET @Val= 100; -- 其余1%情况
INSERT INTO @tmp VALUES(@ID,@Val); -- 插入到你需要的表里,这里是插入@tmp
SET @ID= @ID+1
END
SELECT COUNT(*), Val
FROM @tmp
GROUP BY Val
GO
另一种写法,先定义一个 Scalar-valued function, 然后用这个function 插入。
IF EXISTS (SELECT * FROM sys.objects WHERE object_id = OBJECT_ID(N'[dbo].[fn_GetRand]') AND type in (N'FN', N'IF', N'TF', N'FS', N'FT'))
DROP FUNCTION [dbo].[fn_GetRand]
GO
CREATE FUNCTION [dbo].[fn_GetRand]
(
@Rand FLOAT
)
RETURNS int
AS
BEGIN
DECLARE @Val INT
SET @Rand = @Rand*100;
IF @Rand < 80 SET @Val=0; -- 80% 情况
ELSE IF @Rand < 99 SET @Val=10; --19% 情况
ELSE SET @Val= 100; -- 1%情况
RETURN @Val
END
GO
DECLARE @tmp TABLE(ID INT, Val INT);
DECLARE @ID INT;
SET @ID = 0
WHILE(@ID<1000)
BEGIN
INSERT INTO @tmp VALUES(@ID,dbo.fn_GetRand(RAND())); -- 插入到你需要的表里,这里是插入@tmp
SET @ID= @ID+1
END
SELECT COUNT(*), Val
FROM @tmp
GROUP BY Val
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
如果产生的随机数总数可以确定,你这个问题可以很简单的处理,
假设一共要产生1100个随机数,其中800个0, 200个10, 100个100(符合你的要求)
那么创建1个表,字段为:自增id, value和used, 共1100行记录,值就是上面要求的这些值,used表示使用过没有(默认为0没用过)
每次获取随机数时,select top 1 id, value from 表 where used=0 order by newid()
得到这个数后,马上根据id,把used更新为1
假设一共要产生1100个随机数,其中800个0, 200个10, 100个100(符合你的要求)
那么创建1个表,字段为:自增id, value和used, 共1100行记录,值就是上面要求的这些值,used表示使用过没有(默认为0没用过)
每次获取随机数时,select top 1 id, value from 表 where used=0 order by newid()
得到这个数后,马上根据id,把used更新为1
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
你都随机了 还要求有随机概率...
数据库没有提供这么复杂的方法..
用程序代码控制吧...
数据库没有提供这么复杂的方法..
用程序代码控制吧...
追问
不会就别瞎说 楼上都有给具体实现方法的。
追答
晚上我去验证下 这个方法....
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询