EasyDL轻松搞定对抗学习 多算法比对临床试验数据
【51CTO.com原创稿件】图像学习是一种精巧的算法,其对图像的高适应性,为很多产业变革带来了质变。然而对于企业来讲,找到能够熟练掌握深度学习的人才,来调整图像学习参数是很难的,加上数据科学家团队昂贵的人力资源成本,很多中小企业望而却步。然而,企业对于通过图像识别适配行业解决一些痛点的需求是持续存在的。 百度EasyDL是百度公司为没有算法基础的开发者和企业提供的AI图像识别方案,其具备少数据量、易于操作、快速训练图像识别类AI模型的优势。EasyDL让中小型企业及个人可以在很短的时间获得AI能力,将图像识别投入到生产或者兴趣制作之中,它可作为一套优秀技术解决方案的基石。 图像特征学习算法是从传统图像模式识别算法中衍生的新型算法,其算法原型借鉴于Leica Biosystems的下属品牌Aperio系列软件Image Analysis,是非常成熟的Image Analysis的模式识别算法的迭代进化算法。目前特征学习算法在临床无染色尿沉渣检验医疗器械产品中被越来越多的应用。 在使用传统或是AI的单一算法过程中,无论哪种算法我们都无法让系统自行证明结果的正确性,但当引入竞争算法时,通过两种AI算法可以相互论证结果正确性。 传统单一AI算法无法指出自身的识别错误,往往需要人工复查每一个结果;而对抗算法可以有效的解决这一问题,人工只需要仲裁两种AI的差异结果,即可完成正确的应用过程中推理。而仲裁结果在完全自主对抗系统中,会将仲裁结果重新加入训练集,进而进化两种AI的准确性,这样避免了单一AI算法的过学习,也提高了AI的准确性。 因此,我尝试把EasyDL与特征学习互相对抗,它们均具备良好的易操作性,较少的样本量;且EasyDL与图像特征学习算法互通用学习样本、样本采集及标注工具,故可相互形成对抗互校,形成更高形态的AI学习,在互相较量中形成更为精准的识别模型,不仅可满足企业通过图像学习解决实际问题的需求,而且可以得到较高的识别效果。 下面就以临床检验的数据,按照图像模型制作的8个步骤,来做对抗的详细说明: 特征学习从原始图像中制作成可用于训练的图像模型,需如下八个步骤:图像增强、图像切割、图像标注、图像清洗、训练可用性审核(图像审核)、单种类特征模型学习、多种类特异性特征学习、训练模型注入到作业程序。 EasyDL与特征学习的训练方式基本互通,只是单种类特征模型学习与多种类特异性特征学习过程中,EasyDL是由深度学习作为其中多个逻辑层,自主完成计算。 在训练模型注入到作业程序环节中,特征学习依靠本地内网系统优势自动完成,而EasyDL提供API接口及本地化识别SDK完成部署。 EasyDL与特征学习的对比 1) 图像增强 特征学习提供比较适合临床检验镜下图像的“L30图像增强”,用来调整图像增强参数,以获得更好的图像特征。增强后的图像比增强前的图像更加清晰,细胞内纹路更加鲜明,背景更加纯正,但有时也会遇到过增强,所以要适配显微镜和摄像头参数来进行调节。 2) 图像切割、图像分类、图像标注。 图像切割也可以使用特征学习的快速切割分类标注软件“L31图像标注”系统来完成。L31的使用非常便利,只需要圈选单个细胞,再点击细胞分类,L31就会自动完成图像切割,并自动命名为标注名称,并上传至内网图像数据服务器“HomeShip\FH\细胞名称\”之中。 EasyDL的训练图像需要上传至百度的平台中,所以要在图像清洗作业之后,将每一类细胞、结晶、管型、真菌单独上传即可,可以在EasyDL中直接标注,也可以API上传标注后的训练数据。 特征学习自带的图像切割、分类、标注系统 百度EasyDL的数据操作界面 3) 图像清洗: 图像清洗的目的在于清除掉与目标对象无关的图像信息,让训练模型减少干扰训练的因素。“L33特征学习系统”自带图像修正工具,可以简单高效的处理训练图像,将无效信息去除。修图过程仅需要几步: 1. 点击两次“阔边”,扩大边界范围 2. 点击“标记背景”,让AI能够获知背景色,(小红框) 3. 点击“涂抹”擦掉无效的杂色与杂质 4. 点击“收边”,尽可能将细胞主体放置在图像中央 5. 点击“保存图像”,进行保存 此内置图像修正工具,一般修正一张图像仅需要10秒钟。 4) 图像训练,EasyDL图像上传与审核: 首先是在http://ai.baidu.com/easydl/ 注册或登录,点击开始训练,具体见百度官方说明,然后,创建模型,填写模型名称等相关信息。 点击“开始训练模型”, 选择 “图像分类”或“物体检测”模型进行训练 接下来,以物体检测模型为例,详细介绍使用步骤: 第一步:创建模型。自定义模型名称 (编辑:ASP站长网) |