概述
此为人工智能 (AI) 测试第二篇
第一篇主要介绍了 人工智能测试、测试什么、测试数据等。第二篇主要介绍测试用例和测试报告。
之后的文章可能具体介绍如何开展各项测试,以及具体项目举例如何测试。
测试用例

人工智能 (AI) 测试 或者说是 算法测试,主要做的有三件事。

收集测试数据
    思考需要什么要的测试数据,测试数据的标注
    跑测试数据
    编写测试脚本批量运行
    查看数据结果
    统计正确和错误的个数,查看错误的数据中是否有共同特征等

而编写测试用例,主要是围绕数据来进行。为更好的设计测试用例,首先需要了解一些项目的情况。这些东西如果在《需求文档》中就有描述是最好的。如果没有需要找算法工程师沟通了解。

测试用例的思考点
- 项目落地实际使用场景,根据场景思考真实的数据情况,倒推进行测试数据收集
- 模型的训练数据有多少,训练数据的分布情况,训练数据的标注是否准确
- 算法的实现方式
- 选择模型评价指标
- 评价指标的上线要求
- 项目的流程,数据流
- 模型的输入和输出
- 算法外的业务逻辑

测试用例的执行
运行测试脚本,跑测试数据。
对于一些机器学习的项目的数据,可以通过测试脚本对算法运行的结果和测试数据的标注结果进行对比。
对于图像识别类项目的数据,有些标注无法通过数值来量化,还是需要人工来对比。
对于推荐系统类项目,如 多样性测试,可能也无法通过测试脚本来对比,需要人工来查看。

测试结果
通常是统计正确的和错误的数据数,使用评价指标的公式计算得出各指标数值。
同时,需要关注错误的数据,查看是否有共同的特征,再找些这样的数据单独来进行验证,是否带有此特征的数据都会识别数据。
测试报告

测试结果最终通过测试报告展现,一份详见的测试报告,可以让别人清晰的了解测试什么,怎么测试的,测试结果是怎么样。图片为自己所写测试报告,可供参考。

最新文章

  1. python 之 logging
  2. eclipse中egit插件使用
  3. VC MFC在CMFCToolBar工具栏中加入组合框
  4. UVa 10007 - Count the Trees(卡特兰数+阶乘+大数)
  5. lua 初接触 --- The first time use Lua for programing
  6. 【英语】Bingo口语笔记(42) - Got系列
  7. Java学习笔记之:Java封装
  8. WordPress插件制作教程(八): 最后总结
  9. ADT 连接手机运行android应用程序时报错
  10. python 导入库问题
  11. Linux之mailx的使用
  12. F7里利用DIV 模拟 textarea 显示回行的问题解决
  13. NOIP2007奖学金题解——洛谷1093
  14. HTML5学习总结-番外05 http 状态码
  15. 【C++】实现一个简单的单例模式
  16. yii2场景
  17. struts2在配置文件与JSP中用OGNL获取Action属性
  18. 潭州课堂25班:Ph201805201 并发(进程,线程) 第十一课 (课堂笔记)
  19. python图片和字符串的转换
  20. [原创] GSM/GPRS 以及CDMA区分以及相关模块选型

热门文章

  1. Xamarin.Forms 移动开发
  2. Nginx文章
  3. 中文代码之Django官方入门:建立模型
  4. spark streaming整合kafka
  5. 2.Python爬虫入门_requests
  6. 【Eureka篇三】Eureka比Zookeeper好在哪里?(8)
  7. 微信小程序之结构目录、视图层、双线程模型、生命周期、事件传递冒泡、组件、request、登录授权及支付
  8. USACO Corn Fields
  9. FFT_应用和例题
  10. Java 基础系列:不变性