t-sne数据可视化算法的作用是啥?为了降维还是认识数据?

降维是手段,认识数据是目的。

最近两年 t-SNE 在生物行为学有一些优秀的应用。我认为类似的分析思想和技术将在动物行为的神经基础这一领域起到革命性的作用。

对动物行为的研究,历史上一直局限于两类:

精确测量的简(wu)单(liao)行为。

例如小鼠研究中常用的刺激-反应延时,和左/右选择等。这些研究所测量的行为可以很精确也很稳定,但总是比较没意思。(除了无聊之外这实际上也极大的限制了我们对神经系统的理解)

此类测量的另一个问题是时间上非常粗粒:难以获得高解析度的行为时间序列。

无法精确测量的有趣行为。

常见的ethogram/行为谱即是如此。通常我们拍一段动物在做各种事情的小视频,然后人工去标记不同的阶段(Masters’ style :P)。这类测量只能给出描述性的标签,而且不同的实验者之间往往难以对标签的定义达成完全的共识。

一个例外是鸣禽的唱歌行为。特别是斑胸草雀的歌声极为刻板 / stereotyped,是少见的天然可精确测量的行为。这也是为什么我们用斑胸草雀做为运动学习的模型动物的原因之一。

那么如何实现对有趣行为的精确测量呢?或者用可操作的语言来说,如何将动物的行为转换成精确、可重复、高解析度的时间序列?

Gordon Berman 是将数据降维运用到行为测量的先驱。他在2014年的论文《测量自由运动果蝇的可重复行为》[1] 中使用 t-SNE 对果蝇在二维表面自由运动(即除了飞行)的录像进行降维打击,并得到了如下图谱:

大数据

通过自动化的降维和聚类,将果蝇的行为转换成2维图谱上的轨迹。

所以这有什么用呢?

大数据

当研究者们分析降维后得到的图谱,其中一个意外的发现就是,当作者们比较男果蝇和女果蝇在图谱的密度分布,发现两性在清洁左翅时的动作有微妙的差别。这一性别差异以前没有人知道,是通过比较图谱再回去看视频才发现的。

当然,这一范式的作用远不止于发现以前没有发现的行为差异。最重要的是,通过自动化的数据降维,我们终于可以精确测量并用无岐义的语言描述动物的行为。而这对研究行为的神经学基础有着显而易见的重大意义。

动物行为中一个关键而难以观测的变量是内隐变量,或者说系统的内部状态

今年5月,Gordon 发表了对果蝇行为的进一步分析 ,发现果蝇的运动模式具有层级/hierarchy:

大数据

即,果蝇在行为图谱中的运动在不同的时间尺度可以被描述为一系列层级。这个概念本身没什么稀奇:谁都知道动物的行动有层级性。但是如何理解不同层级之间的关系呢?这一分析方法首次给出了关于什么是层级的可靠的定义

用户喜欢...

大数据和云计算的冲突

最近,IT行业专家在参加相关会议时发现了一个隐藏的主题,那就是虽然很多人将关注的重点转移到基于云计算的架构...


智能家居为何需要大数据, 大数据在智能家居领域的贡献是什么?

大数据分为大数据存储和大数据分析,属于两种截然不同的计算机技术领域,大数据存储用于大数据分析。大数据存储重点在于研发可以扩展至PB甚至EB级别的数据存储平台;大数据分析关注在...


陆金所计葵生:深度解析大数据和AI对未来金融影响

陆金所联席董事长兼CEO计葵生在北京大学数字金融研究中心「数字金融的中国时代」第二届年会上发表主题演讲,深...


大数据时代:十大最热门的大数据技术

随着大数据分析市场快速渗透到各行各业,哪些大数据技术是刚需?哪些技术有极大的潜在价值?根据弗雷斯特研究公司发布的指数,这里给出最热的十个大数据技术。 1、预测分析 预测分析是...


乐橙视频云锁闪耀发布,让家与你不再有距离

大华乐橙在深圳会展中心召开了2017 “锁定天下”乐橙智能锁新品发布会,重磅发布了乐橙首款视频云锁。本次发布会...


Nutanix通过Cloudera Enterprise认证,携手打造精简大数据企业云

企业云计算领导者Nutanix今日在2017 .NEXT用户大会(北京站)上宣布,其企业云平台软件已通过Cloudera技术认证计划(...


超过300亿美元的工业级无人机市场将呈爆发式增长, 上海无人机展会引领行业发展

当消费级无人机市场已成为一片红海之际,各大无人机厂商都在工业级无人机领域发力以争夺高端行业应用的市场,...


浪潮与百度联合发布ABC一体机 推进智慧计算的行业落地

在9月举办的2017 百度云智峰会 ABC SUMMIT 上,百度与浪潮共同发布了 ABC 一体机,双方将共同推动人工智能、大数据、云...


IDC发布《IDC MarketScape:中国大数据管理平台厂商评估,2017》

中国大数据市场整体热度逐步降低,数据应用开始落地,而应用的前提是建设统一的大数据管理平台。IDC调研了几十...


中科院国科创新与深圳福田区一揽子战略合作落子于CEEC

北京国科金服科技金融信息服务有限公司(以下称“国科金服”)与中国国际消费电子展示交易中心(以下称“CEEC”...


CA Technologies宣布为IBM z14提供支持交付可信任的系统

CA Technologies (NASDAQ:CA)今日宣布,CA关键的大型主机解决方案为IBM z14提供支持。CA的解决方案利用全新的z14平台,大大降...


大数据新时代:物联网让生活更加智慧

物联网(IoT,Internet of Things)这一概念最早在1999年提出。美国麻省理工学院建立的“自动识别中心(Auto-ID)”,首次提出“万物皆可通过网络互联”,并阐明物联网的基本含义。早期的物联网仅是...


技术牛逼也要懂点社交:数据科学家公司生存指南TOP30秘诀

作者:SeattleDataGuy 数据科学家老司机的30个经验之谈,教你如何在公司内获得认同,带你绕过他们曾经踩过的坑。 作...


20个数据可视化工具点评

第一部分:入门级工具 1.Excel Excel的图形化功能并不强大,但Excel是分析数据的理想工具,上图是Excel生成的热力地图...


商机 | 大数据/政务云采购清单 招标7起,最高招标价为2089.41万(9.2-9.5)

文 | 36大数据 奥兰多 一、政府、企事业单位大数据/政务云中标成交清单,一共8起,最高成交价为1388.89万 二、政府、...


华为轮值CEO郭平:将长期投入公有云 不靠用户数据变现

作者:郭晓峰 在今日举行的华为 2017 全联接大会上,华为轮值 CEO、副董事长郭平表示,华为承诺长期投入公有云建设...