ai开发正文发私信给汪思颖发送0

导语:讲者梳理了神经模型在关系抽取中的发展脉络,并分享相关领域的最新工作进展。雷锋网ai研习社按:关系抽取是自然语言处理中的重要任务,也是从文本中挖掘知识的基本途径之一。深度学习

导语:在这种类型的竞赛和问题中,特征工程和特征选择是最重要的。雷锋网ai科技评论按:kagglecreditdefaultrisk比赛日前落下帷幕,该比赛总奖金7万美元,第一名奖金35000美元,第

2)如果需要预训练词向量,只能使用fasttext预训练的词向量模型。

3)如果需要使用翻译模型或翻译语料,只能使用主办方提供的翻译结果。

agglekaggle本专题为雷锋网的kaggle专题,内容全部来自雷锋网精心选择与kaggle相关的最近资讯,雷锋网读懂智能与未来,拥有kaggle资讯的信息,在这里你能看到未来的世界。_

导语:现在的闲聊机器人在对话的互动性、一致性以及逻辑性上都还存在着一些亟待解决的缺陷。雷锋网(公众号:雷锋网)ai研习社按:现如今,诸如小冰这类闲聊机器人逐渐进入了大众的视野,甚至成为了一部分人打发闲暇时光

  • 导语:从静态图像中识别目标一直是计算机视觉比较热门和有挑战性的课题,目前最受欢迎的方法非深度学习莫属,但是其检测速度和大数据量的需求也一直存在着很大的问题。雷锋网(公众号:雷锋网)按:极链科技video++   整理| 包包

    从静态图像中识别目标一直是计算机视觉比较热门和有挑战性的

  • 导语:此前的方案中,大家都忽略了汉字本身的重要性质——汉字是由偏旁部首组成。雷锋网ai科技评论按:随着互联网的飞速发展,图片成为信息传播的重要媒介,图片中的文本识别与检测技术也一度成为学界业界的研究热点,应用在诸如证件照识别、信息采集、书籍电子化等领域。

    然而,一直以来存在的问题是,尚没有基于网络图片的、以中文为主的ocr数据集。基于这一痛点,阿里巴巴「图像和美」团队推出mtwi数据集,这是阿里首个公开的ocr数据集,也是现有难度最大、内容最丰

导语:得到第一,将中华美食传扬出去~提到kddcup,相信数据挖掘领域的同学并不陌生。作为目前数据挖掘领域最有影响力、最高水平的国际顶级赛事,kddcup至今已举办21届,每年都会吸引世界数据挖掘界的顶尖专家、学者、工程师、学生等前来参赛,被外界誉为大数据领域的「奥运会」。

今年的kddcup从空气问题入手,组委会在比赛中提供中国北京和英国伦敦的相关数据,比赛选手需要预测5,pm10和o3的浓度(5和pm10)。在48小时后,选手提交的结果将通过真实的天气数据评分。

虽然kddcup2018在今年6月就已经结束,冠军团队也早已揭晓,但对冠军团队的正式颁奖是在刚刚结束的kdd2018上。

本次比赛共吸引了来自全球4183支队伍,包括49个国家的3000多所学校或机构,北京邮电大学韩金栋、张前前、刘娟,中南大学罗宾理、蒋浩然组成的「firstfloortoeatlatiao」团队在该项赛事中取得第一名。作为此次比赛的冠军,「firstfloortoeatlatiao」团队受邀参与此次大会,在会上展示了他们的,也第一时间对雷锋网ai科技评论进行分享。看到队名,相信大家便对这一团队充满好奇。在组队的时候,队员张前前提出这个以吃为主题的名字,并得到大家全票通过。「我们都很喜欢吃辣条,辣条是中华民族的传统美食,我们想要得第一,将中华美食传扬出去。」

团员组成如下:

队长韩金栋,北京邮电大学硕士在读,喜欢用数学建模方法去解决实际生活中的问题;

队员张前前,北京邮电大学硕士在读,擅长特征工程和深度学习;

队员刘娟,北京邮电大学硕士在读,对数据分析和数据可视化感兴趣;

队员罗宾理,中南大学本科二年级在读,擅长特征工程和模型融合(骚操作);

队员蒋浩然,中南大学硕士在读,擅长数据分析与时间序列。

以下便是这一团队带来的:

主要的挑战有三点:

空气质量变化十分迅速,并且有很多突变点;

污染物会向周边扩散,具有复杂的空间依赖关系;

空气质量受很多复杂因素的影响,因此需要很强的专业领域知识。使用到的基本特征:___过去72小时的空气质量___预测前最后一小时的天气___未来48小时的天气预报___月份、周末、小时、假期、站点id

除了基本特征,我们还从时域、空域、频域和专业领域知识四个方面分别构建特征群,一共提取了100多个特征,这些特征是模型提分的关键。利用预测时间附近天气预报数据的统计(不同的统计方式,可以统计预测时间节点之前的统计信息,也可以以预测时间节点为中心进行统计)防止天气突变。

针对短期预测问题,过去的天气变化可以影响到未来几个小时的空气质量。因此我们设计了不同大小的窗口,用来提取过去天气的统计特征,这些特征提高了模型的短期预测能力。

我们还发现未来48小时的天气预报是影响空气质量长期预测和突变预测的一个关键因素,因此我们针对未来的天气预报设计了很多细粒度的特征,具体可以看下图。如果绿色点是我们要预测的时间节点,为了描述预测时间点之前和附近的天气变化,我们使用滑动窗口提取了预测时间点之前的天气预报统计信息以及附近的天气预报统计信息。通过这些特征,提高了长期预测的准确率。此外,为了区分要预测的是第一天还是第二天,我们使用了一个标志位特征,将预测时间标为。

团队成员曾经获奖记录:

neurips2018automl(phase1)

双面珠花布.Capture

ddkdd本专题为雷锋网的kdd专题,内容全部来自雷锋网精心选择与kdd相关的最近资讯,雷锋网读懂智能与未来,拥有kdd资讯的信息,在这里你能看到未来的世界。

不一样的论文

毛巾条形布.Capture

导语:ai研习社「职播间」上线!我们常说企业就是为了挣钱,学校就是可以安心做纯粹科研的象牙塔,但在计算机领域,企业和学校,或者说工业界和学术界之间的人才流动、交流合作非常多,企业也都有自己的技术追求

竹纤维系列

芯片ai芯片本专题为雷锋网的ai芯片专题,内容全部来自雷锋网精心选择与ai芯片相关的最近资讯,雷锋网读懂智能与未来,拥有ai芯片资讯的信息,在这里你能看到未来的世界。

ai