欢迎来到相识电子书!
标签:数据分析
-
问卷统计分析实务
本书的内容架构,在于完整介绍问卷调查法中的数据处理与其统计分析流程,统计分析技术以SPSS统计软件包的操作界面与应用为主,内容除基本统计原理的解析外,着重的是SPSS统计软件包在量化研究上的应用。内容包括问卷编码、创建文件与数据处理转换、预试问卷之项目分析及信效度检验,以及正式问卷常用的统计方法介绍,包括相关、复选题及卡方检定、平均数的差异检定、单因子多变量变异数分析、回归分析、主成分回归分析、逻辑斯回归分析、区别分析等。 本书以实务应用及使用者界面为导向,对于以SPSS统计软件包来进行量化研究的使用者而言,相信有不少帮助,综括本书的内容,有五大特色:完整的操作步骤与使用程序介绍,研究者只要依书籍步骤,即能完成数据统计分析工作;操作画面与说明以SPSS14.0中文版窗口界面为主,符合多数研究者的需求;详细的报表解析与说明,让读者真正了解各种输出统计量的意义;报表结果的统整归纳,选用的范例可作为论文写作的参考;内容丰富而多元,兼顾基本统计与高等统计。 -
社会网络分析
本书以基于Python的网络分析包NetworkX作为社会网络分析工具,但不是一本NetworkX使用手册。作者将重点放在如何从庞大的社会网络分析学术积累中,挑选最精要与最实用的知识点,以帮助读者形成关于社会网络分析的知识谱系图。全书可以分为四部分。第1章和第2章是基础知识,主要介绍社会网络分析的背景信息与图论基础知识。第3~5章主要介绍如何分析社会网络,分别从个体与群体两个层面,介绍社会网络的主要测量指标与分析方法。其中第3章重点介绍社会网络节点层面的四个核心指标: 程度中心性:哪些是明星人物?哪些是边缘者?程度中心性回答类似问题。这是最为人们理解的社会网络测量指标。以微博为例,程度中心性就是粉丝的数量,那些程度中心性高的人就是微博中的明星。 亲近中心性:亲近中心性通过点与其他点的距离来测量。那些在社交网络中经常与人互动、人际关系颇好的人,比如公司中的八卦传播者,往往亲近中心性得分较高。 居间中心性:节点的居间程度,表示一个网络中经过该点最短路径的数量。在网络中,节点的居间程度越大,那么它在节点相互之间的信息传播起到的作用也就越大。在两个社会网络之间的人,比如跨界者,往往拥有较高的居间中心性。 特征向量中心性:那些在社交网络中沉默却拥有极大权力的人物,如《教父》中的主人翁柯里昂。社会网络研究者将他们称为“灰衣主教”。特征向量中心性就是找出他们的办法。基本原理是,一个有着高特征向量中心性的行动者,与他建立连接的很多行动者往往也被其他很多行动者所连接。在社交网络中,有这样一种人,很多明星与其做朋友,即使他沉默不语,也可能是一位重要的人物。 社会网络分析不仅仅在节点层面测量。第4章、第5章介绍如何分析群体。其中,第4章主要介绍社群划分的基础知识:如何将庞大的社会网络划分为小的组块?如何利用社会网络中的结构洞牟利?如何进行三元组普查与分析?例如,如何通过岛屿方法逐步找出推特上埃及革命的成千上万条转发的核心人物?又如,如何评估埃及革命中一个人的信息传播能力?显然,如果你的朋友们相互信任,将比那种一个明星发言,粉丝们单纯收听的星形网络传播能力更强。第5章主要介绍二模网络与多模网络的基础知识。关系还会存在于不同类型的主体之间,比如公司雇佣员工、投资者购买公司股票、人们占有信息与资源等。这些关系称为二模关系。现实生活中的关系往往是二模或多模。比如在微博上,可以通过你的兴趣、地域、使用的标签来为你推荐新的朋友,或者基于你对一些公共事件的看法,将你划分到特定政治群体中,这些都是基于二模或多模网络的分析得出的。 第6章是全书最精彩的部分,关注信息如何传播,初步展示分析动态社会网络发展的建模技巧。一条微博如何从一两个人关注突然成为流行用语?作者在实验中发现,当网络密度接近7%的时候,将从线性增长(每次增加一条连接)转化为病毒式扩散,也就是说,如果转发一条微博、加入一个网络社群等的人数比例达到7%,其他人将会在关键阶段马上跟进。这是一个推动脸谱走出哈佛大学的神奇数字。脸谱一步一步地跃迁,总是遵循一个规则——在一个社群里到达饱和点之后才移入一个更大的社群。作者通过手写Python算法,为读者打开动态社会网络与网络仿真的大门——我们如何用算法来模拟人类社会各类关系的变迁?有了自己亲手实践算法的经验,读者未来使用netlogo等网络仿真软件,将更加得心应手。 对于初学者来说,第4~6章这三章有一定难度,需要同时理解社会科学与编程技巧两方面知识。第7章则简单明了,主要介绍获取网络数据的入门知识。如果希望深入了解,可以阅读作者推荐的相关资源。附录A介绍收集社会网络分析所需数据的传统方法、伦理准则与相关API。附录B介绍如何安装本书涉及的相关软件,如NetworkX、matplotlib等。 总而言之,作为一本技术非常新颖的入门读物,本书通俗易懂,基于Python进行分析使得其灵活性变得更高。可以说,本书令学习者从一开始就具有上手实践的能力,除介绍网络数据获取技巧、网络抽样方法、网络在个体与群体两个层面的基本属性之外,还涉及目前日益热门的网络模拟方法,融合基础理论与算法于一身。简约却不简单,上升空间非常大!无论你是对社会网络感兴趣的大众读者,还是社会网络的专业研究者、开发者,相信本书都会在社会网络的理论与实践两方面给予启发! -
行为科学统计学入门
本书为入门的统计学教科书,主要介绍了描述统计和推论统计,特别适合那些缺乏高等数学知识的初学者。作者在保证科学性的前提下,对基础而重要的统计学概念给予了简明易懂的界定,并配有贴切的简化事例;所有计算公式均有详细具体的演示程序和操作步骤;每章结尾均针对学习者在学习过程中可能出现的问题予以难点提示,并进行简要总结。贯穿始终的典型融合更易于读者了解全书结构,建构统计学知识体系。能让初学者读懂、会用,这是本书的宗旨,也是其特色。 -
SPSS统计分析基础教程
《SPSS统计分析基础教程》内容简介:SPSS是最为优秀的统计软件之一,深受各行业用户的青睐。为满足广大读者学习统计学入门知识和统计软件入门操作的需求,《SPSS统计分析基础教程》改变了以往SPSS书籍对统计理论和软件操作“两条主线、各自表述”的编写方式,将两者完全融合起来。全书共分15章,以SPSS 12.0为准,针对统计初学者和SPSS初级用户的需求。以统计理论为主线,详细介绍了在SPSS中的界面操作、数据管理、统计图表制作、统计描述和常用单因素统计分析方法的原理与实际操作。其内容覆盖了目前国内大部分专业本科统计课程的教学范围,并结合SPSS的强大功能做了很好的扩展。各章后均附有参考文献和思考练习题,涉及统计理论的章节还提供了本章小结。全书内容深入浅出,风格简洁明快,是一本难得的统计理论与SPSS操作相结合的教材。 《SPSS统计分析基础教程》可用作各专业本科生和研究生的统计学教材,也可作为SPSS 10~12版的通用入门教材,可供各行业中非统计专业背景的人员以及希望从头学习SPSS软件的人员使用。 -
数学的语言
是什么让一架巨型喷汽式飞机悬浮在空中? 是什么让美式足球比赛出现在电视荧幕上? 数学让那些看不见的变得可见。 数学是一种模式的科学,是我们看待世界,包括外在的物理、生物与社会世界,和内在心智世界的一种方式。数学的美,隐藏在数字、点、线与面、几何图形、函数等符号中。 从古典数学(代数)到现代语言分析,从几何学、微积分到拓扑学、统计学及物理学,本书将从各学科层面,提示如何用数学去看见自然里不可见的结构;同时,从数学的发迹讲起,直至今日发展,提供一个清楚而贯通的网络。 -
谁说图表不会说谎
饼状图可以扩大或缩小实际数据的百分比;线性图可通过改变Y轴范围,强化图形的高峰和低谷;堆积图则可以利用下层数据的波动来改变上层数据的起伏…… 你还会相信亲眼所见的图表吗?本书为你还原各种图表的真实面目,揭开图表背后隐藏着不为人知的秘密。读懂这些小伎俩,看透误导人的鬼把戏,避免由此带来的各种损失。 -
删除
《删除》讲述了遗忘的美德,为读者展现了大数据时代的取舍之道。 《删除》从大数据时代信息取舍的目的和方法分别诠释了“被遗忘的权利”。维克托首先回溯了人类追寻记忆的过程,之后提出数字技术与全球网络正在瓦解我们天生的遗忘能力。对此,他考察了促进遗忘终止4大驱动力——数字化,廉价的存储器,易于提取,全球性访问。之后,他提出了当前数字化记忆的两大威胁——信息权力与时间,并给出了应对威胁的6大对策——数字化节制、保护信息隐私权、建设数字隐私权基础设施、调整人类的现有认知、打造良性的信息生态、完全语境化。最后,他提出了一种应对数字化记忆与信息安全的极有可能的关键对策——给信息设定存储期限。 《删除》开启了一场 “互联网遗忘运动”,让我们始终记得遗忘的美德。这本书告诉我们,在大数据时代,面对海量信息人类该如何取舍,怎样才能构建一个积极而安全的未来。 《删除》讲述了遗忘的美德,为读者展现了大数据时代的取舍之道。数字技术赋予了我们前所未有的权利,它也产生了意想不到的可怕后果。facebook上照片会被网络永远铭记,甚至会影响到一个人的职业发展;Google记得所有我们搜索过的信息和时间。数字王国记住了那些有时最好被遗忘的信息。 删除,大数据取舍之道,就是把有意义的留下来,把无意义的去掉。只有理解了在大数据中,需要的是什么,以及如何判断这种需要,才能举一反三地明白到底为什么要去掉那些不需要的。 维克托•迈尔-舍恩伯格,大数据时代的预言家,《科学》《自然》等著名学术期刊最推崇的互联网研究者之一,“大数据商业应用第一人”,拥有在哈佛大学、牛津大学、耶鲁大学和新加坡国立大学等多个互联网研究重镇任教的经历。 中国社科院信息化研究中心秘书长姜奇平作序倾情推荐。北京大学新闻与传播学院副教授胡泳、中国科学院理论物理研究所研究员李淼、麻省理工学院教授大卫•克拉克、国际著名信息隐私权专家保罗•施瓦茨、斯坦福大学互联网与社会中心创办人劳伦斯•莱斯格、波士顿咨询公司高级副总裁菲利普•埃文斯 联袂推荐 《删除》一经出版,即获得美国政治科学协会颁发的“唐•普赖斯奖”,以及媒介环境学会的最高荣誉“马歇尔•麦克卢汉奖”,同时受到《连线》《自然》《华尔街日报》《纽约时报》等各大权威媒体广泛好评。 《删除》洞见了“被遗忘的权利”,探索了大数据时代人类该如何构建积极而安全的未来。 -
The Data Journalism Handbook
When you combine the sheer scale and range of digital information now available with a journalist’s "nose for news" and her ability to tell a compelling story, a new world of possibility opens up. With The Data Journalism Handbook, you’ll explore the potential, limits, and applied uses of this new and fascinating field. This valuable handbook has attracted scores of contributors since the European Journalism Centre and the Open Knowledge Foundation launched the project at MozFest 2011. Through a collection of tips and techniques from leading journalists, professors, software developers, and data analysts, you’ll learn how data can be either the source of data journalism or a tool with which the story is told—or both. Examine the use of data journalism at the BBC, the Chicago Tribune, the Guardian, and other news organizations Explore in-depth case studies on elections, riots, school performance, and corruption Learn how to find data from the Web, through freedom of information laws, and by "crowd sourcing" Extract information from raw data with tips for working with numbers and statistics and using data visualization Deliver data through infographics, news apps, open data platforms, and download links -
决战大数据
[内容简介] 大数据时代的来临,给当今的商业带来了极大的冲击,多数电商人无不“谈大数据色变”,并呈现出一种观望、迷茫、手足无措的状态。车品觉,作为一名经验丰富的电商人,在敬畏大数据的同时,洞悉到了数据时代商业发展的更多契机,他创新了数据框架的建立和使用,重新量化了数据价值的指标,并挖掘了在无线数据和多屏时代下商业发展的本质……在他看来,改变思维方式,即可改变数据和商业的未来。 《决战大数据》将视角投入到“大数据实践”的领域,对数据收集、数据化运营、运营数据、无线数据、数据盲点和噪音、数据分类和数据价值、养数据、多屏时代等大数据应用的热点问题做出了详细的解答,对当今的大数据进行了多角度思考,并提出了做好“个人大数据管理”的前瞻性建议,创建了一个数据化运营和运营数据的闭环系统。同时,《决战大数据》首次揭开阿里巴巴运营数据的神秘面纱,解密了其数据实践的“混、通、晒”内三板斧和“存、管、用”外三板斧,对于当今的绝大多数电商企业来说十分有借鉴意义。 《决战大数据》是继经典畅销书《大数据时代》之后聚焦中国大数据实践的重磅新作。 [编辑推荐] 大数据实践的先行者、阿里巴巴集团副总裁、数据委员会会长车品觉首部个人专著:拥有十几年丰富的数据实战经验,并在实践中形成了独特的数据化思考方式,对电子商务未来趋势有独到见解,曾先后在汇丰银行、香港电讯盈科、微软、eBay等多家著名跨国公司任总监。 继《大数据时代》之后聚焦中国大数据实践的重磅之作,引领“大数据实践”风潮:《决战大数据》为数据人拨开大数据时代的层层迷雾,对数据化运营和运营数据的热点问题做了详细的解答,为现代商业的发展提供了数据应用的前瞻性建议和商业新范本。 聚焦阿里巴巴的大数据实践,首次揭开阿里巴巴运营数据的神秘面纱:解密了阿里巴巴大数据实践的“混、通、晒”内三板斧和“存、管、用”外三板斧,还原最真实的阿里巴巴。 首度提出“数据化思考”新思维,改变思维,决胜数据化未来:作者认为大数据时代更多地改变了人类的思维模式,只有掌控大数据背后真正的思维变革才是决胜未来商业的关键。 洞悉大数据与个人、商业与个人的内在联系,指出了“个人大数据管理”的重要性:无论是电商管理层,还是数据分析师,每个人都要有完善的个人大数据管理模式,以避免数据收集和使用中出现信息不对称的断层。 最接地气的大数据著作,既是商业人和电商从业者的案头必备书,也是管理层的决策宝典:作者列举了大量国内领先电商和自身经历的经典“数据分析实例”。内容深入浅出,语言通俗易懂。对当今国内的绝大多数企业来说,更有针对性、借鉴性、实操性,也更接地气。 国内8大顶尖电商和投资人强力推荐,迄今为止最有重量的数据实践之作:eBay 大中华区CEO林奕彰、唯品会创始人沈亚、红杉中国董事总经理刘星、 大众点评网CEO 张涛、安客诚全球副总裁程杰、京东集团高级副总裁徐雷、 桔子水晶酒店集团创始人吴海、LinkedIn商务分析部总监张溪梦等联袂推荐。 图书个人所得全部捐献给“桑珠助学”和雪谦寺重建。 湛庐文化出品。 -
看穿一切数字的统计学
你也许相信“数字会说话”,小心!数字可能经过加工,目的就是巧妙地误导你的判断。 你也许只看统计结果不看过程,小心!任何统计过程中都可能有你意想不到的疏漏。 你面前的数据来自有公信力的机关,小心!你觉得完全可信的数据,也可能存在陷阱。 《看穿一切的统计学》告诉你,海量数据中,哪些数字能帮你做出准确判断,哪些会让你走入误区? 《看穿一切数字的统计学》,一点儿也不无聊的统计学入门书,不用艰深的数学式,就能理解统计学的基本概念,用故事点出主题,让你学得透彻,看得过瘾。学会统计学,看穿一切数字背后的真相! -
社交网站的数据挖掘与分析
Facebook、Twitter和LinkedIn产生了大量宝贵的社交数据,但是你怎样才能找出谁通过社交媒介正在进行联系?他们在讨论些什么?或者他们在哪儿?这本简洁而且具有可操作性的书将揭示如何回答这些问题甚至更多的问题。你将学到如何组合社交网络数据、分析技术,如何通过可视化帮助你找到你一直在社交世界中寻找的内容,以及你闻所未闻的有用信息。 每个独立的章节介绍了在社交网络的不同领域挖掘数据的技术,这些领域包括博客和电子邮件。你所需要具备的就是一定的编程经验和学习基本的Python工具的意愿。 •获得对社交网络世界的直观认识 •使用GitHub上灵活的脚本来获取从诸如Twitter、Facebook和LinkedIn之类的社交网络API中的数据 •学习如何应用便捷的Python工具来交叉分析你所收集的数据 •通过XHTML朋友圈探讨基于微格式的社交联系 •应用诸如TF-IDF、余弦相似性、搭配分析、文档摘要、派系检测之类的先进挖掘技术 •通过基于HTML5和JavaScript工具包的网络技术建立交互式可视化 -
深入浅出统计学
样章试读请到下面的链接下载: 目录 http://goo.gl/tlCLf 序言 http://goo.gl/65x6e 第一章 http://goo.gl/WTnC9 第二章 http://goo.gl/5WUhT 若下载遇到问题,请邮件联系:lispython@gmail.com。谢谢! 《深入浅出统计学》具有深入浅出系列的一贯特色,提供最符合直觉的理解方式,让统计理论的学习既有趣又自然。从应对考试到解决实际问题,无论你是学生还是数据分析师,都能从中受益。本书涵盖的知识点包括:信息可视化、概率计算、几何分布、二项分布及泊松分布、正态分布、统计抽样、置信区 间的构建、假设检验、卡方分布、相关与回归等等,完整涵盖AP 考试范围。本书运用充满互动性的真实世界情节,教给你有关这门学科的所有基础,为这个枯燥的领域带来鲜活的乐趣,不仅让你充分掌握统计学的要义,更会告诉你如何将统计理论应用到日常生活中。 -
啤酒与尿布
啤酒和尿布》的故事是营销届的神话,“啤酒”和“尿布”两个看上去没有关系的商品摆放在一起进行销售、并获得了很好的销售收益,这种现象就是卖场中商品之间的关联性,研究“啤酒与尿布”关联的方法就是购物篮分析,购物篮分析是沃尔玛秘而不宣的独门武器,购物篮分析可以帮助我们在门店的销售过程中找到具有关联关系的商品,并以此获得销售收益的增长! -
统计学
《统计学:从概念到数据分析》主要介绍了概率基础、统计的基本概念、描述性统计、估计、假设检验、回归与分类等内容,同时介绍了决策树、神经网络和随机森林等组合方法以及如何用R、SPSS、SAS等软件来实现相应的计算目标。 -
数据科学实战
• 统计推断、探索性数据分析(EDA)及数据科学工作流程 • 算法 • 垃圾邮件过滤、朴素贝叶斯和数据清理 • 逻辑回归 • 金融建模 • 推荐引擎和因果关系 • 数据可视化 • 社交网络与数据新闻 • 数据工程、MapReduce、Pregel和Hadoop -
电商大数据——用数据驱动电商和商业案例解析
《电商大数据——用数据驱动电商和商业案例解析》重点介绍了电子商务数据驱动的理论和商业案例。《电商大数据——用数据驱动电商和商业案例解析》作者具有丰富的电商团队数据化管理与运营经验。全书共分三篇。上篇主要介绍了电子商务的战略、战术和数据驱动的思想,有助于读者深入了解电商模式;虽然上篇皆是从宏观层面切入,但是基本都使用了定量的描述方式。中篇介绍了数据如何产生实实在在的生产力,主要包括建立数据化体系的方法、广告的投放策略、艺术设计与数据驱动的融合。下篇是大数据案例,主要包括量化管理客服团队、大数据供应链管理、大型促销活动节点管理、客户“怪诞”行为研究、CRM 及基于网络爬虫调整架上库存。 在《电商大数据——用数据驱动电商和商业案例解析》的目录中给出了200 组客户67 个维度指标的真实数据,这些源数据是非常珍贵的资源,为客户行为研究提供了不可或缺的基础资料。 《电商大数据——用数据驱动电商和商业案例解析》适合独立B2C 商城的高管、各种电商平台的店长和数据驱动相关从业者使用,也适合作为在校电子商务本科生和研究生的参考用书。 -
数据挖掘:实用案例分析
《数据挖掘:实用案例分析》是数据挖掘实战领域颇具特色的一部作品,作者曾为10余个行业上百家大型企业提供数据挖掘服务,本书是其在数据挖掘领域探索近10年的经验总结之作。全书以实践和实用为宗旨,深度与广度兼顾,实践与理论并举。 《数据挖掘:实用案例分析》共12章,分三个部分。第一部分是基础篇(第1~4章),主要对数据挖掘的基本概念、应用分类、建模方法及常用的建模工具进行了介绍,并对本书所用到的数据挖掘建模平台TipDM进行了说明。第二部分是实战篇(第5~10章),以案例的形式对数据挖掘技术在金融、电信、电力、互联网、生产制造以及公共服务等行业的应用场景进行了讨论;首先介绍案例背景,然后阐述分析方法与过程,最后完成模型构建;在介绍建模过程的同时穿插操作训练,把相关的知识点嵌入相应的操作过程中;此外,第10章精心设计了6个实验项目,读者可以通过本章介绍的方法动手实践,以巩固数据挖掘知识,在分析建模过程的同时,进一步增强动手能力。第三部分是高级篇(第11~12章),主要介绍基于第三方接口的数据挖掘二次开发技术,重点对常用的WEKA和MATLAB数据挖掘算法接口进行了探讨;最后对基于Hadoop框架的海量数据挖掘进行了说明,以满足读者更高层次的需求。 随书光盘中提供了本书的相关资料和案例资源,以及6个动手实验所使用的完整数据,方便读者动手实践书中所讲解的案例。 -
数据掘金
电商坐拥互联网行业最丰富的用户数据金矿,却很少有人从中挖掘出真金白银。《数据掘金——电子商务运营突围》一书旨在打破这一困境,一步一步引导从业者以数据为核心来运营网站或网店。本书用浅显的文字与独特的视角,不仅成功解读电商数据运营之惑,更呈现大量数据分析和挖掘的必要基础知识及实用相关工具。在通过阅读轻松掌握电商数据运营须关注的要点与方法之后,读者还可有针对性地从书中选择学习如何利用数据来完成——流量获取优化、广告投放、客户分析,以及客户价值提升等一系列电商运营要务。 《数据掘金——电子商务运营突围》一书主要写给电商从业人员,无论是中小电子商务的运营人员、数据分析人员,还是大公司负责电子商务的策略官、市场官和运营官,都能从本书中找到自己所需且急需的有价值内容。 -
商业竞争分析
《商业竞争分析:有效运用新方法与经典方法》详细展现了24种当今最有价值的经营管理和竞争力分析的工具方法,既有经典方法如麦肯锡7S分析。也有最新的分析手段,有些在我国还是第一次系统提及。每一个方法都会详细介绍其优劣势、使用步骤和案例分析等几个方面。这些工具和技巧囊括了战略管理的各个层面:战略分析、竞争和客户分析、环境分析、评估分析和财务分析等。《商业竞争分析:有效运用新方法与经典方法》独有的FAROUT评价分析,还让读者在了解分析技巧的同时,根据其自身的商业环境和战略意图选择适合的战略分析工具和技巧。 -
Advanced R
Advanced R presents useful tools and techniques for attacking many types of R programming problems, helping you avoid mistakes and dead ends. With more than ten years of experience programming in R, the author illustrates the elegance, beauty, and flexibility at the heart of R. The book develops the necessary skills to produce quality code that can be used in a variety of circumstances. You will learn: -The fundamentals of R, including standard data types and functions -Functional programming as a useful framework for solving wide classes of problems -The positives and negatives of metaprogramming -How to write fast, memory-efficient code This book not only helps current R users become R programmers but also shows existing programmers what’s special about R. Intermediate R programmers can dive deeper into R and learn new strategies for solving diverse problems while programmers from other languages can learn the details of R and understand why R works the way it does.
热门标签
下载排行榜
- 1 梦的解析:最佳译本
- 2 李鸿章全传
- 3 淡定的智慧
- 4 心理操控术
- 5 哈佛口才课
- 6 俗世奇人
- 7 日瓦戈医生
- 8 笑死你的逻辑学
- 9 历史老师没教过的历史
- 10 1分钟和陌生人成为朋友