some = sample data 0.1

 
遍历整个数据集,获取指定比例的行数的数据,获取的数据不确定,条数也不准确。
 
内部重写为filter data by random() <= 0.1
 
 
抽取100行数据
data = load 'data';
grpd = group data all;
sums = foreach grpd generate COUNT(data) as c;
some = sample data 100/(double)sums.c;

  

 

最新文章

  1. xsl-mode属性用法
  2. EL函数以及自定义标签的应用
  3. Head First 设计模式 --10 状态模式
  4. sobel算子原理及opencv源码实现
  5. 3D音效
  6. 跟我学STL系列(1)——STL入门介绍
  7. DNA repair问题
  8. 获取客户端的IP地址
  9. zzuoj 10409 10409: D.引水工程
  10. 【CF】283D Tennis Game
  11. 基于visual Studio2013解决算法导论之030二叉查找树
  12. hdu_5777_domino(贪心)
  13. netty常用使用方式
  14. Spring初始化ApplicationContext为null
  15. Cocos2D v3.x中关于重叠触摸层优先级的问题
  16. (2.1)mysql升级与降级
  17. Xamarin 自定义 ToolbarItem 溢出菜单实现(Popover/Popup) 弹出下拉效果
  18. Dapper查询返回Datatable
  19. 【C++】undered_map的用法总结(1)
  20. [CF960G] Bandit Blues

热门文章

  1. (转) DB2 HADR
  2. (转)MySQL慢查询日志总结
  3. Javascript中Date对象的格式化
  4. php 实现繁体转简体代码效率对比
  5. 编写Android工程里测试代码的步骤
  6. asp.net三种方法实现事务
  7. linux-统计文本中符合条件的内容
  8. Docker运行操作系统环境(BusyBox&amp;Alpine&amp;Debian/Ubuntu&amp;CentOS/Fedora)
  9. 二叉树的LCA(最近公共祖先)算法
  10. Lucene系列-facet--转