从具有加权行概率的PostgreSQL表中选择随机行
栏目: 数据库 · PostgreSQL · 发布时间: 7年前
内容简介:代码日志版权声明:翻译自:http://stackoverflow.com/questions/13040246/select-random-row-from-a-postgresql-table-with-weighted-row-probabilities
示例输入:
SELECT * FROM test; id | percent ----+---------- 1 | 50 2 | 35 3 | 15 (3 rows)
你如何编写这样的查询,平均50%的时间我可以得到id = 1的行,35%的时间行id = 2,15%的时间行id = 3?
我尝试像SELECT id FROM测试ORDER BY p * random()DESC LIMIT 1,但它给出错误的结果. 10,000次运行后,我得到一个分布,如:{1 = 6293,2 = 3302,3 = 405},但我预计分布接近:{1 = 5000,2 = 3500,3 = 1500}.
有任何想法吗?
这应该是诀窍:
WITH CTE AS (
SELECT random() * (SELECT SUM(percent) FROM YOUR_TABLE) R
)
SELECT *
FROM (
SELECT id, SUM(percent) OVER (ORDER BY id) S, R
FROM YOUR_TABLE CROSS JOIN CTE
) Q
WHERE S >= R
ORDER BY id
LIMIT 1;
子查询Q给出以下结果:
然后我们在范围[0,100]中简单地生成一个随机数,并选择该数字以上的第一行(WHERE子句).我们使用通用表表达式(WITH)来确保随机数仅计算一次.
BTW,SELECT SUM(percent)FROM YOUR_TABLE允许您以百分比表示任何权重 – 它们不会严格需要百分比(即加起来为100).
代码日志版权声明:
翻译自:http://stackoverflow.com/questions/13040246/select-random-row-from-a-postgresql-table-with-weighted-row-probabilities
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:- 负载均衡算法 — 平滑加权轮询
- matlab练习程序(加权最小二乘)
- matlab练习程序(局部加权线性回归)
- 加权随机采样 (Weighted Random Sampling)
- 使用加权轮询算法和 Go 实现 HTTP 负载分发代理
- CVPR2019 | ASRCF:基于自适应空间加权相关滤波的视觉跟踪研究(即将开源)
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
CSS实战手册(第2版)
[美] David Sawyer McFarland / 俞黎敏 / 电子工业出版社 / 2010-6 / 69.80元
本书从介绍最基本的CSS知识开始,到建立用于打印网页的CSS和改进你的CSS习惯的最佳实践。将关于CSS的选择器、继承、层叠、格式化、边距、填充、边框、图片、网站导航、表格、表单、浮动布局、定位网页上的元素,以及用于打印网页的CSS等技术通过逐步地讲解与教程串联了起来。每章内容从简单到复杂,一步一步地建立起一个完整的教程示例,并在每章都会详细讨论一些技巧、最佳实践和各浏览器之间一致性的兼容问题及如......一起来看看 《CSS实战手册(第2版)》 这本书的介绍吧!