公开课 | 用CNN识别CT影像诊断肺癌结节+从GitHub社交数据中挖掘人才+量化投资中的数据处理,3场直播连击

百家 作者:大数据文摘 2017-12-12 05:44:07

大家好,文摘菌又来搞事情啦~?


本周四晚,大数据文摘联合六禾创投,三场公开课,一!起!来!?


三位公开课嘉宾分别来自六禾创投被投公司华院数据、简寻、聚宽,公开课主题跨越深度学习医疗影像识别、社交网络数据挖掘、金融数据量化投资。



最近,文摘菌报道过吴恩达团队用CNN识别肺炎影像的论文(戳这里阅读),吴恩达团队用到的是胸部X光片数据,胸片被认为长远看来将被CT取代,那么这次就来听听用CT影像是怎么个玩儿法吧!


社交网络数据挖掘听起来非常有趣,想知道GitHub上有多少中国人吗?答案是70万。怎么通过构建高性能的爬虫框架、Spark用户聚合、构建模型识别出他们?


股票更是有很多群众入坑,作为大数据文摘读者怎么能不懂一点量化呢?可是你知道到哪里找数据吗?又如何取样、清洗、存储呢?


还有2天开讲,抓紧时间扫码进直播间嗨起来吧!公开课收看方式请往下翻?


请注意:每个人都可以在直播间中生成专属邀请函并分享给朋友。邀请人数排名前3的小伙伴,将获赠清华数据科学研究院与大数据文摘联合出品的2017年《顶级数据团队建设全景报告》一份。



1

深度学习在医学影像CAD(计算机辅助诊断)领域中的应用:以肺结节智能检测和诊断技术为例


肺癌是我国死亡率和发病率最高的恶性肿瘤。目前手术是根治肺癌的主要治疗方法。早期肺癌多以肺小结节的形式出现,多数患者没有明显临床症状,早期发现困难。在各种肺癌筛查手段中,CT检查是目前最有效的方法。


早期肺癌结节的尺寸小、对比度低、形状异质化程度高,识别难度大,因此筛查工作是由影像科专家人员人工读片完成,检出率也极度依赖于阅片医生的水平。以一家医院平均每天接待200位左右的肺结节筛查患者为例,每位患者在检查环节会产生200—300张的CT影像,放射科医生每天至少需要阅读4万张影像图像。随着我国老龄化程度不断加深,医学影像服务需求不断增长,这种繁重的人工阅片工作无疑会成为广大医务工作者的沉重负担,也会成为人们追求更优质医疗服务的一大障碍。


因此,对于CT影像阅片工作,急需借助高度自动化技术(例如人工智能自动阅片系统)的辅助,来解决这种庞大工作量的问题。另外,我国医疗资源的严重不平衡,很多医疗条件欠佳地区,由于不能及时确诊,往往导致病人因得不到相应的治疗而死亡。随着基于人工智能技术的远程医学影像诊断平台的普及,将会使此类地区能够享受到国际一线水准的肺癌早期筛查与诊断服务。




本次分享将以深度学习在医学影像CAD领域的进展和成果为铺垫,重点介绍利用3维深度卷积神经网络进行肺小结节检测(识别与定位)和诊断(病灶良恶性分析等等)的相关技术原理与实际应用。内容将涉及肺部CT影像的图像预处理技巧,3维深度卷积网络的运用技巧、网络训练与调优技巧以及利用此类技术开发实际应用中的经验之谈等等。最后,将从其它非影像数据角度来探讨结合多维度健康大数据,有效融合人工智能及大数据技术,推进此领域相关应用更好的开展。

分享人简介

杨晶晶,现任华院数据技术公司医学影像CAD技术负责人,多年来一直从事图像识别、机器学习技术研究和产品开发工作。先后在公安部第三研究所、华院数据技术公司参与并主导基于模式识别、机器学习、深度学习等技术的多种智能产品研发,产品应用领域覆盖安防、视频、医学影像CAD等领域。近年来主持肺小结节智能检测与诊断产品的研发。

时间&如何参与

12月14日(周四)19:00-19:40

扫码进入直播间

▼▼▼

2

社交数据挖掘实战:如何从社交数据中挖掘优质人才


企业在快速发展的过程中,都会面临人才不足的问题。优质人才的招募缓慢严重阻碍了企业的发展速度。而候选人在目前除了投递简历、通过猎头推荐和内推,也很少有其他渠道能接触到优质机会。国内并没有一款像Linkedin一样的产品,能做到对优质人才的高覆盖率,让企业招聘人员有机会快速联系到想招募的人才。优质人才的信息散布在网络之上,企业招聘人员很难高效使用相关信息。


本次公开课将把Github人才数据挖掘为一个主要案例,讲解整套系统的构建方式和其中的算法模型。内容主要涉及大规模分布式爬虫的构建,基于Spark的数据处理系统,候选人潜力值判断、候选人职业方向判断和华人识别等相关算法,为大家分享一些在无法获取大量标注数据的开放数据集上的数据挖掘经验。

分享人简介

李嘉航,高中时期通过信息学竞赛保送华中科技大学。毕业任职简寻,负责大数据平台以及数据挖掘与算法研发。主要负责简寻旗下一款收集优质人才在网络上踪迹的产品,希望能够完成对人才职业相关数据的重构,通过数据的方式重建一份职业数据,让企业招聘人员能更高效地使用网络开放数据寻找优质候选人。

时间&如何参与

12月14日(周四)19:40-20:20

扫码进入直播间

▼▼▼

3

金融量化中的数据处理


随着大数据、机器学习等人工智能技术的兴起,国内的量化投资的发展进入了快车道。国内量化基金的资产管理规模,近年均以每年近40%的速度快速增长。量化行业的快速发展对量化相关联的数据提出了更高要求:从数据的干净程度到数据的tick级颗粒度,都有新要求。精准的数据和快速的回测引擎能够提升整个量化系统的效率,加快对市场的反应速度,提供有效决策依据。


本次公开课将以金融中大量数据处理技术和方法作为主题,并结合聚宽实践的数据处理技术对其中的案例进行分析,同时告诉大家如何在模型中使用一些特定数据。

分享人简介

郭嵩聚宽CTO,全栈工程师,本硕毕业于北京科技大学计算机系,曾任职于百度、腾讯,6年互联网研发经验,熟悉前端、分布式系统、大数据并发。

时间&如何参与

12月14日(周四)20:20-21:00

扫码进入直播间

▼▼▼


致谢


感谢六禾创投对本次活动的大力支持,以上3位公开课嘉宾均来自六禾创投的投资企业。


六禾创投是一家以科技和数据为驱动力的投资机构,也是国内最专业的大数据领域创业投资公司,秉持少而精的投资哲学,在数据服务和数字内容(包括AR/VR领域)进行了深度布局。投资团队拥有深厚的投资、科技和创业经验,投资项目后期融资表现亮眼,包括央数文化(小熊尼奥AR儿童玩教具)、JoinQuant聚宽(量化交易平台)、朋友印象(深度社交和数据)、曼恒数字(VR引擎与行业应用解决方案)、数尊信息(信用金融)、华院数据(行业大数据)、云账房(财税智能化)、美信金融(全球资产交易平台)等。六禾创投希望和更多有理想、接地气的创业者进行深入合作。



关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接