您现在的位置是:首页 > 科技资讯科技资讯

黑客seo(防搜索是什么意思)

编辑 2024-06-03 12:35:31 科技资讯

1. 黑客seo,防搜索是什么意思?

防搜索是指通过一系列技术手段来保护个人或组织的信息不被搜索引擎索引和收录的一种方法。它可以通过限制搜索引擎的爬虫访问网站、使用robots.txt文件、设置页面的noindex标签等方式来实现。防搜索的目的是保护隐私、防止敏感信息被泄露,同时也可以防止竞争对手获取到关键信息。防搜索在一些特定场景下非常重要,例如政府机构、军事机构、企业商业机密等领域。

黑客seo(防搜索是什么意思)

2. 租用站群服务器需要注意什么?

站群服务器是单独为一个网站或者多个网站配置独立IP的一种服务器。企业或是用户如果想组建多个网站的话就需要用站群服务器了。站群服务器可以提高搜索引擎多个网站的关注度,提高网站文章的收录以及网站文章的访问量,这也是网站SEO优化的重要一步。如果这些网站结构或者内容大致相同,那么就需要独立的IP去支撑,如果这些网站域名都解析到同一个IP,那搜索引擎会轻易认定是垃圾网站,网站权限以及访问量自然不会提升。而站群服务器对外部链接的促进作用很明显,就是为了给客户提供多种IP资源,为多个网站做优化的。 站群服务器有哪些分类呢?分为国内站群服务器,美国站群服务器,香港站群服务器。通常美国和香港的IP资源比较充足 1、如果是小型企业或是个人网站,网站的承载量不是很多的话,成本没有太多预算的情况下,可以选择国内站群IP服务器。可能速度比不上香港站群服务器,但是价格和配置都要比香港和韩国的便宜,带宽弹性与稳定性都是不错的。 2、香港站群服务器比国内访问速度更快更稳定,但是由于带宽成本高,导致香港站群机器价格较贵。不过贵有贵的优势,除了速度更快更稳定外,还有优质的售后,一般可以与技术直接交流沟通,性能是很不错的。 3、美国站群专用服务器ip资源更加充足,因为国内访问速度比香港机器慢,价格低。如果是小型企业或是个人网站,网站的承载量不是很多的话,但对成本有比较大的要求的时候,可以考虑选择美国RAKsmart的站群IP服务器。可能速度比不上香港站群服务器,但带宽弹性与稳定性也还不错。 其实站群专用服务器也是服务器的一种,只是为站群多网站专门研发的一款服务器,配备多个ip,能满足多个网站有独立的ip,保证网站在百度的排名,避免受到搜索引擎的的惩罚。下面我们探讨下站群服务器做好优化的优势是: 站群服务器拥有大量独立ip,有数量多的达到两百多个,因为ip资源丰富,而且都是独立的,对站群优化有着很大的作用;多IP站群服务器,可以大大降低同一IP上的网站数量,如果网站数量在120下,还可以每个网站分配一个独立IP,从而减少网站之间的分权;如果几个网站同时放在一个ip上面,这样会被搜索引擎视为垃圾网站,做违规处理。如果一个网站拥有一个独享ip的话,搜索引擎会比较看重,网站的权重和排名也会提高;多站群IP服务器会避免一个IP上放多个网站而被误杀;每个网站都是独立的,互不干扰,如果有别的网站受任何惩罚,其他的网站也不会受到影响。多IP站群服务器为站群优化用户开发的服务器。 以上RAKsmart对站群服务器以及服务器做好优化的观点,如果有不足之处还请见谅。

3. 网站建设之前需要注意些什么?

我们在做一个网站的过程中,会有很多的问题产生。如果我们在前期把这些问题都考虑到位的话,注意并且避免这些问题的话,那么我们的网站肯定会顺顺利利的完成,并且达到我们想要的效果?那么在网站建设前期、中期、后期都需要注意些什么?今天企尚网络的老徐就来给大家分析一下。

第一、网站建设前期需要注意的问题

1、明确建站目的 建站前,明确自己的网站是信息服务型、销售型、销售服务型或是综合型,是面向企业客户的网站还是面向个体消费者的网站。

2、选择合适的网站域名 域名对于网站的重要性不言而喻,一个方便好记的域名更容易被用户记住,方便用户再次浏览网站

3、找准核心 一个企业可能有很多产品,或者相关联的附属品,我们要找准核心,确立核心关键词。主推自己的优势。不要杂乱无章,贪多嚼不烂。

4、网站结构和网站功能的构思 有清晰的网站结构思路,对网站的整体结构,对网站功能的需求明确,方便后期与制作者沟通交流,才可快速制作出令自己满意的网站。

5、整理公司的特色点 在明确建立网站时,不能千篇一律,现在市场上的很多网站能展现企业特色的网站并不多,所以,在建立网站的时候需要给用户眼前一亮,给客户一种新鲜的感觉。

6、资料整理 提前做好准备,把公司相关资料准备好,如:产品图片,公司相关的文章等等,这样能够有效提升网站的建设速度。

第二、网站建设中期需要注意的问题

1、文字的选择和设计 有些页面的内容很少,连文字都不多,但是自己做网站的时候不得不重视文字的设计。文字的设计包括字体的选择、大小的设计、间距、多种字体应该怎样和谐地设计在一起,这些都是文字设计的关键。即使是在同一个页面,使用的字体都不止一种样式,有些甚至会有三四种。一般情况下,在设计字体的时候,选择两种或者以上的字体才能表现出更佳的效果。

2、图片的设计 图片在做网站过程中是一个核心的部分,很多站长在设计页面的时候,都会在图片的设计上花费很多心思和时间。这是因为很多用户在浏览网站的时候,会被图片吸引,而不会在页面上花费太多时间。所以,做网站时图片的设计就显得非常重要,一定要在第一时间吸引用户。例如苹果公司的官方网站,都是直接将产品展示给用户。

3、交互设计 交互设计在做网站的地位非常重要,但是在设计交互时,需要很多方面的配合。但是想要将多个元素排列在同一个页面的话,就要考虑很多问题。在设计交互的时候,要站在用户的角度考虑。例如导航的位置更合适,元素通过哪一种方式展示出来更加合适,元素之间怎样排版才能达到更佳的效果。站长们做网可以通过原型设计相关的功能,设计出一个合理的、有舒适用户体验的交互设计。

第三、网站建设后期需要注意的问题

1、要做好用户体验 试想一下,如果你是用户,通过搜索引擎来到一个排名不错的网站,但是网站的界面、架构一团糟,感觉像是个无人管的垃圾站,你还会继续浏览吗?网站的作用就是展示内容、产品给用户看的,如果用户一进网站就走了,网站还有用吗。

2、需要建立404页面 很多人都会忽视这方面的问题,往往会给你的网站带来不必要的损失。有人认为只要用死链检测工具检测,就不会有事,但你不能保证时时刻刻能检测到死链,而一旦出现死链,你又没及时发现,就会给网站带来负面影响。

3、网站定期备份 网站定期备份这是非常重要又经常被忽略的问题。有人认为自己网站程序相当安全,建站这么长时间,都没出现问题,网站备不备份不要紧。这就像雨天打手机,被雷劈的概率是万分之一的一样,但是一旦被劈到将是致命的。

4、定期查看网站日志 作为网站管理人员,应该养成查看网站日志的习惯,如果没有,你就不是一个合格的网站管理人员。通过网站日志,我们可以了解到网站存在的问题。查看网站日志,我们可以了解到搜索引擎什么时候访问了网站,又访问了哪些页面,经常访问哪些页面,这些信息都对我们进一步优化改善网站非常重要。

5、网站安全设置 网站定期备份是网站安全最后的防御,网站的安全设置是抵御黑客的金钟罩。

6、网站日常更新 如果长时间不更新变容易被搜索引擎判断为“僵尸网站”,不会再抓取,面对恒久不变内容客户也没有新鲜感,就不会再来访问网站了。略懂一点SEO的都知道,网站日常更新重点不是为了填充网站,而是利用新内容保持网站活跃度,让搜索引擎能每天来抓取。而新内容也是让客户保持对网站有兴趣的一个重要方式。

7、网站优化 网站优化是一个需要长期操作,日复一日循环渐进才能产生效果。优化是枯燥的,企业想要把网站排名提升上去,就需要有这样的心理准备。网站建设首先就要做好站内优化,这主要体现在网站内容方面,这跟刚才说到的第一点不径相同。网站内容是优化的一部分,除了这个还需要把网站内部所有能优化的都优化,组织部客户访问网站并不是所有关注点都在内容方面。

8、网站外链建设 网站的外部链接是优化的一部分。外部优化的特点是使用不同的平台发布或多或少带有企业名称或网站链接的信息。目的是让客户知道有这样的公司。感兴趣的客户将通过搜索或点击链接访问企业网站。

网站建设前期、中期、后期,如果上面的说的这些问题能够引起你的注意及重视,老徐相信你的网站肯定能给你带来意向不到的效果。如果你只是为了做一个网站而做一个网站的话,我想网站最终也会忽略你。

4. 用什么工具系统查看源代码比较好?

静态源代码安全检测工具比较

1. 概述

随着网络的飞速发展,各种网络应用不断成熟,各种开发技术层出不穷,上网已经成为人们日常生活中的一个重要组成部分。在享受互联网带来的各种方便之处的同时,安全问题也变得越来越重要。黑客、病毒、木马等不断攻击着各种网站,如何保证网站的安全成为一个非常热门的话题。

根据IT研究与顾问咨询公司Gartner统计数据显示,75%的黑客攻击发生在应用层。而由NIST的统计显示92%的漏洞属于应用层而非网络层。因此,应用软件的自身的安全问题是我们信息安全领域最为关心的问题,也是我们面临的一个新的领域,需要我们所有的在应用软件开发和管理的各个层面的成员共同的努力来完成。越来越多的安全产品厂商也已经在考虑关注软件开发的整个流程,将安全检测与监测融入需求分析、概要设计、详细设计、编码、测试等各个阶段以全面的保证应用安全。

对于应用安全性的检测目前大多数是通过测试的方式来实现。测试大体上分为黑盒测试和白盒测试两种。黑盒测试一般使用的是渗透的方法,这种方法仍然带有明显的黑盒测试本身的不足,需要大量的测试用例来进行覆盖,且测试完成后仍无法保证软件是否仍然存在风险。现在白盒测试中源代码扫描越来越成为一种流行的技术,使用源代码扫描产品对软件进行代码扫描,一方面可以找出潜在的风险,从内对软件进行检测,提高代码的安全性,另一方面也可以进一步提高代码的质量。黑盒的渗透测试和白盒的源代码扫描内外结合,可以使得软件的安全性得到很大程度的提高。

源代码分析技术由来已久,Colorado 大学的 Lloyd D. Fosdick 和 Leon J. Osterweil 1976 年的 9 月曾在 ACM Computing Surveys 上发表了著名的 Data Flow Analysis in Software Reliability,其中就提到了数据流分析、状态机系统、边界检测、数据类型验证、控制流分析等技术。随着计算机语言的不断演进,源代码分析的技术 也在日趋完善,在不同的细分领域,出现了很多不错的源代码分析产品,如 Klocwork Insight、Rational Software Analyzer 和 Coverity、Parasoft 等公司的产品。而在静态源代码安全分析方面,Fortify 公司和 Ounce Labs 公司的静态代码分析器都是非常不错的产品。对于源代码安全检测领域目前的供应商有很多,这里我们选择其中的三款具有代表性的进行对比,分别是 Fortify公司的Fortify SCA,Security Innovation公司的Checkmarx Suite和Armorize公司的CodeSecure。

2. 工具介绍

2.1. Fortify SCA(Source Code Analysis)

Fortify Software公司是一家总部位于美国硅谷,致力于提供应用软件安全开发工具和管理方案的厂商。Fortify为应用软件开发组织、安全审计人员和应用 安全管理人员提供工具并确立最佳的应用软件安全实践和策略,帮助他们在软件开发生命周期中花最少的时间和成本去识别和修复软件源代码中的安全隐患。 Fortify SCA是Fortify360产品套装中的一部分,它使用fortify公司特有的X-Tier Dataflow™ analysis技术去检测软件安全问题。

优点:目前全球最大静态源代码检测厂商、支持语言最多

缺点:价格昂贵、使用不方便

2.2. Checkmarx CxSuite

Checkmarx 是以色列的一家高科技软件公司。它的产品CheckmarxCxSuite专门设计为识别、跟踪和修复软件源代码上的技术和逻辑方面的安全风险。首创了以查询语言定位代码安全问题,其采用独特的词汇分析技术和CxQL专利查询技术来扫描和分析源代码中的安全漏洞和弱点。

优点:利用CxQL 查询语言自定义规则

缺点:输出报告不够美观、语言支持种类不全面

2.3. Armorize CodeSecure

阿码科技成立于2006年,总部设立于美国加州圣克拉拉市,研发中心位于台湾的南港软件工业园区。阿码科技提供全方位网络安全解决方案,捍卫企业免于受到黑客利用 Web 应用程序的漏洞所发动的攻击。阿码科技 CodeSecure可有效地协助企业与开发人员在软件开发过程及项目上线后找出 Web 应用程序风险,并清楚交代风险的来龙去脉 (如何进入程序,如何造成问题) 。CodeSecure内建语法剖析功能无需依赖编译环境,任何人员均可利用 Web操作与集成开发环境双接口,找出存在信息安全问题的源代码,并提供修补建议进行调整。CodeSecure依托于自行开发的主机进行远程源代码检 测,在保证速度稳定的同时方便用户进行Web远程操作。

优点:Web结合硬件,速度快、独具特色的深度分析

缺点:支持语言种类较少、价格不菲

3. 对比

Fortify SCA简写为SCA,Checkmarx CxSuite简写为CxSuite,Armonize CodeSecure简写为CodeSecure。

SCA CxSuite CodeSecure

厂商 Fortify Software Checkmarx 阿码科技

支持语言 Java,JSP,ASP.NET,C#,

VB.NET,C,C++,COBOL,

ColdFusion,Transact-SQL,

PL/SQL,JavaScript/Ajax,

Classic,ASP,VBScript,VB6,PHP JAVA、ASP.NET(C#、VB.NET)、JavaScript、Jscript、C/C++、APEX ASP.NET(C#、VB.NET)、ASP、JAVA、PHP

风险种类 400种 300种 参考CWE

风险类型参考来源 CWE、OWASP CWE、OWASP CWE、OWASP

漏报率 最低 低 低

误报率 稍高 低 低

是否支持SaaS 否 否 是

软硬件类型 纯软件 纯软件 Web结合硬件设备

运行平台 无限制 WindowsNET Framework 2.0 无限制

运行速度 取决于电脑配置速度不定 取决于电脑配置速度不定 由主机配置决定速度恒定

报告格式 PDF PDF、XML、CSV、HTML Web、PDF

报告内容 完整按照风险级别不同分为多个文件 核心内容完整扫描信息等缺失 非常完整但修改建议放于最后

报价 100万/软件 70万/软件 100万/软硬件

性价比 中 高 低

从软件支持的源代码语言上来说,Fortify SCA(下文简称SCA)支持多达17种语言,Checkmarx CxSuite(下文简称CxSuite)其次,而Armonize CodeSecure(下文简称CodeSecure)在三款软件中支持的最少,仅仅支持几种最常见语言,不过这几种基本涵盖了绝大多数应用中使用的编程语言,基本上可以支持现在大多数应用的源代码扫描。

从风险的分类来说,各个厂商都有其自己独特的分类方式和不同的种类数量,不过从实际应用中可以看出,总体上仍为OWASP公布的几类风险,如SQL注入、跨站脚本等,已经可以满足实际中开发人员和测试人员的需求,对于各个厂商不同的部分,一般来说主要的区别在于理解不同,看问题的角度不同,并无谁错谁对之原则性问题。

从运行平台 的角度,CodeSecure这个产品目前看来已经将SaaS的理念很好的融合进来,整个软件的操作界面为Web方式,用户可以通过网页进行操作,B/S 的方式可以将操作系统的影响降到最低,只要有一台可以上网的电脑和浏览器,无论什么操作系统都可以使用CodeSecure远程进行源代码扫描,CodeSecure依托的是一台Armonize自行研制的主机,使用硬件设备的好处在于可以适用于多种场合,不会因为测试人员或是开发人员的电脑配置影响扫描速度,扫描的速度完全取决于主机的性能。而SCA和CxSuite主要还是单机软件,但目前也在不断地向SaaS的方向进行过渡,并且提供了相当全面的贯彻整个软件开发流程(SDLC)的解决方案与服务给用户。其中CxSuite这个产品标明了使用该软件的硬件配置,为Windows操作系统 和.NET框架,这个产品目前应该为利用.NET框架进行开发,所以运行环境有一定的局限性。同时,SCA和CxSuite因为是单机软件,一方面在使用 前需要安装,另一方面其运行速度取决于运行软件的电脑性能,对于使用该软件的电脑配置有一定的要求。

三种产品都使用了各自的技术对于威胁进行检测,SCA使用的是已获得专利的X-Tier™数据流分析器,这三种产品中只有CxSuite声称可以达到零误报率,因为 其对于风险的理解是风险必须在外形上呈现出来才被考虑为实际的风险,这种理解方式可以说是别出心裁,从代码安全的角度来说,检测的目的是为了发现问题并及时改正,同时要针对于最关键的问题进行改正,这也是这三款软件都包含TOP X的统计的目的,从这一点上讲,CxSuite的风险报告是非常谨慎的。SCA在以前的使用中发现有一定的误报率,不过换个角度想,误报相比漏报是可以容 忍的,规则越严格,误报率就会相应的上升而漏报率就会相应的下降,源代码检测工具目前均为静态的进行代码的扫描,即所有的检测均是按照“规则”来进行,任 何一款产品都不可能达到真正的零误报、零漏报。所以可以说SCA的规则检查稍显简单,CxSuite和CodeSecure的检查比较谨慎。

而从漏报率上来看,谨慎的查找势必会导致漏报率的提升,这一点上SCA和CodeSecure只说明了低漏报率,而CxSuite内部包含了一种类似于C#称为 CxQL的查询语言,支持使用这种语言进行查询,方便用户进行特定的查找。另两款软件使用的都是规则的方式,其本质上应该是相类似的,这一点上规则似乎更 容易被用户接收,但是CxQL的方式确实增强了用户的操作性。

从结果输出 上来说,三款软件都支持多种输出方式,而作为报告PDF格式可以说是最书面的一种格式。在这一点上,三款软件输出格式略有不同。

SCA报告构成如下:扫描概述、按风险的分类进行详细描述,包括每个风险的发现位置,代码上下文,风险源和风险输出,以及改进方法,各类风险描述之后是按照风险类别 的所有风险的统计和按照风险等级的统计图表。SCA的每种类型的文件生成一个PDF文件,便于用户对于风险严重程度的不同采取不同的策略。

CxSuite 报告构成如下:风险按照不同分类方式的统计图、风险的数据统计情况、风险最高的文件TOP 10、按照类别进行风险详述,包括风险的名称、描述、常见危害、在软件开发各阶段的相应处理方式、详细示例,列举每一个风险的传输路径和相应位置代码。

CodeSecure 报告构成如下:目录、重点精华,包括检测信息、弱点密度规范分布趋势、弱点最多的文件TOP 5,弱点索引,弱点的详细信息,包括弱点的全程跟踪,最后是弱点信息及修改建议、所有的进入点。

三款软件的 报告中以SCA的最有特色,将不同级别的风险分文件显示对于程序员进行修改是极为方便的;CodeSecure的报告最为规范,整个文档包括目录,结构完 整,唯一的不足是将风险的修改建议放在了最后,查阅有些不便;CxSuite的内容可以说是最概要的,只包含了风险的最关键内容,对于程序员来说应该是最 简洁的。

4. 总结

这三款静态源代码扫描工具都有其各自特色,SCA支持的语言多达17种,基本上涵盖了绝大多数的应用,具有相 当广泛的适用性,但同时也使得其价格非常昂贵;CxSuite支持的语言包括常见Web应用的语言,适用范围基本上包括了大部分的应用,其使用独创的语言来自定义规则非常有特色,价格较之SCA有一定的优势;CodeSecure支持的语言较少,不过基本上可以适用于当前大多数的B/S结构应用,它是唯一 的软硬件结合的产品,在免除用户安装步骤的同时将扫描运行于特定设备之上,有助于提高运行速度,也因为包括硬件的缘故,其价格不菲。

SCA极广的适用性使其适用于横跨多种语言的开发和测试人员,CxSuite的较高性价比使其适于基于Web 的开发人员和测试人员,CodeSecure稳定的速度和B/S的独特结构使得Web开发或测试的多人同时使用变得极为方便。

随着应用的安全性越来越受到人们的重视,静态源代码扫描和动态扫描将逐渐融合,未来将会有更多更优秀的源代码扫描工具诞生,让我们拭目以待吧。

附录A 其他静态源代码检测产品

公司 产品 支持语言

art of defence Hypersource JAVA

Coverity Prevent JAVA .NET C/C++

开源 Flawfinder C/C++

Grammatech CodeSonar C/C++

HP DevInspect JAVA

KlocWork Insight JAVA .NET C/C++,C#

Ounce Labs Ounce 6 JAVA .NET

Parasoft JTEST等 JAVA .NET C/C++

SofCheck Inspector for JAVA JAVA

University of Maryland FindBugs JAVA

Veracode SecurityReview JAVA .NET

FindBug PMD/Lint4

5. 不同类目的店铺可以共用一个ip吗?

不同类目的店铺不可以共用一个IP地址。IP地址是计算机网络中用于唯一标识一台设备的地址,每个设备都有一个独特的IP地址。同一个IP地址可以被多个设备使用,但同一时间只能有一个设备在线。

为了保护用户账户的安全,速卖通等电商平台会限制同一个卖家操控多个账户。具体来说,速卖通会通过店铺中产品的相似度去判断店铺是否关联,如果产品、标题、图片、描述等信息高度相似或完全相同,平台就会认定这两个店铺是关联的,进而进行封店处理。此外,亚马逊、Shopee等平台也有类似的规定。

因此,不同类目的店铺不能共用一个IP地址。如果需要在多个店铺之间使用相同的IP地址,建议使用不同的IP地址或者在同一台设备上使用多个账户。

6. 如何学习数据分析?

想要成为数据分析师,给大家分享一份初级的入门指南!

它包含Excel、数据可视化、数据分析思维、数据库、统计学、业务、以及Python。

这七part 的内容刚好涵盖了一位数据分析师需要掌握的基础体系,也是一位新人从零迈入数据大门的知识手册。

第一part:Excel

每一位数据分析师都脱离不开Excel。

它是日常工作中最常用的工具,如果不考虑性能和数据量,它可以应付绝大部分分析工作。虽然现在机器学习满地走,Excel依旧是无可争议的第一工具。

Excel的学习分为两个部分。

掌握各类功能强大的函数,函数是一种负责输入和输出的神秘盒子。把各类数据输入,经过计算和转换输出我们想要的结果。

在SQL,Python以及R中,函数依旧是主角。掌握Excel的函数有助于后续的学习,因为你几乎在编程中能找到名字一样或者相近的函数。

在「数据分析:常见的Excel函数全部涵盖在这里了」中,介绍了常用的Excel函数。

清洗处理类:trim、concatenate、replace、substitute、left/right/mid、len/lenb、find、search、text

关联匹配类:lookup、vlookup、index、match、row、column、offset

逻辑运算类:if、and、or、is系列

计算统计类:sum/sumif/sumifs、sumproduct、count/countif/countifs、max、min、rank、rand/randbetween、averagea、quartile、stdev、substotal、int/round

时间序列类:year、month、weekday、weeknum、day、date、now、today、datedif

搜索能力是掌握Excel的不二窍门,工作中的任何问题都是可以找到答案。

第二部分是Excel中的工具。

在「数据分析:Excel技巧大揭秘」教程,介绍了Excel最具性价比的几个技巧。包括数据透视表、格式转换、数组、条件格式、自定义下拉菜单等。正是这些工具,才让Excel在分析领域经久不衰。

在大数据量的处理上,微软提供了Power系列,它和Excel嵌套,能应付百万级别的数据处理,弥补了Excel的不足。

Excel需要反复练习,实战教程「数据分析:手把手教你Excel实战」,它通过网络上抓取的数据分析师薪资数据作为练习,总结各类函数的使用。

除了上述要点,下面是附加的知识点,铺平数据分析师以后的道路。

了解单元格格式,数据分析师会和各种数据类型打交道,包括各类timestamp,date,string,int,bigint,char,factor,float等。

了解数组,以及相关应用(excel的数组挺难用),Python和R也会涉及到 list,是核心概念之一。

了解函数,深入理解各种参数的作用。它会在学习Python中帮助到你。

了解中文编码,UTF8、GBK、ASCII,这是数据分析师的坑点之一。

第二part:数据可视化

数据分析界有一句经典名言,字不如表,表不如图。

数据可视化是分析的常用技巧之一,不少数据分析师的工作就是通过图表观察和监控数据。首先了解常用的图表:

Excel的图表可以100%绘制上面的图形,但这只是基础。

在「数据可视化:你想知道的经典图表全在这」中介绍了各类数据分析的经典图表,除了趋势图、直方图,还包括桑基图、空间图、热力图等额外的类型。

数据可视化不是图表的美化,而是呈现数据的逻辑之美,是揭示数据的内在关联。了解图表的维度和适用场景,比好看更重要。比如桑吉图就是我一直推崇的图表,它并不知名,但是它能清晰的揭露数据内在状态的变化和流向。案例是用户活跃状态的趋势。

Excel的图表操作很傻瓜化,其依旧能打造出一份功能强大的可视化报表。「数据可视化:教你打造升职加薪的报表」教给大家常用的Excel绘图技巧,包括配色选取,无用元素的剔除、辅助线的设立、复合图表等方法。

Excel图表的创造力是由人决定的,对数据的理解,观察和认知,以及对可视化的应用,这是一条很长的道路。

图表是单一的,当面板上绘制了多张图表,并且互相间有关联,我们常称之为Dashboard仪表盘。

上图就是用分析师薪资数据为数据源绘制的Dashboard,比单元格直观不少。我们常常把绘制这类Dashboard的工具叫做BI。

BI(商业智能)主要有两种用途。一种是利用BI制作自动化报表,数据类工作每天都会接触大量数据,并且需要整理汇总,这是一块很大的工作量。这部分工作完全可以交给BI自动化完成,从数据规整、建模到下载。

另外一种是使用其可视化功能进行分析,它提供比Excel更丰富的交互功能,操作简单,而且美观,如果大家每天作图需要两小时,BI能缩短大半。

在「数据可视化:手把手打造BI」教程中,以微软的PowerBI举例,教大家如何读取数据,规整和清洗数据,绘制图表以及建立Dashboard。最后的成果就是上文列举的分析师案例。

BI还有几个核心概念,包括OLAP,数据的联动,钻取,切片等,都是多维分析的技巧,也是分析的核心方法之一。

后续的进阶可视化,将和编程配合。因为编程能够提供更高效率和灵活的应用。而BI也是技术方向的工具,了解技术知识对应用大有帮助。

第三part:数据分析思维数据分析能力的高低,不以工具和技巧决定,而以分析思维决定。

在一场战争中,士兵装备再好的武装,进行再严苛的训练,若是冲锋的方向错了,那么迎接他们的唯有一败涂地。

分析思维决定一场「数据战争」中的冲锋方向。只有先养成正确的分析思维,才能使用好数据。

既然是思维,它就倾向于思考的方式,Excel函数学会了就是学会,分析则不同。大多数人的思维方式都依赖于生活和经验做出直觉性的判断,以「我觉得我认为」展开,好的数据分析首先要有结构化的思维。

麦肯锡是其中领域的佼佼者,创建了一系列分析框架和思维工具。最典型地莫过于金字塔思维。

这篇文章简述了该思维的应用,「快速掌握麦肯锡的分析思维」。你能学会结构化思考,MECE原则,假设先行,关键驱动等方法论。

除此以外,还有SMART、5W2H、SWOT、4P4C、六顶思考帽等,这些都是不同领域的框架。框架的经典在于,短时间内指导新人如何去思考,它未必是最好的,但一定是性价比最优的。数据分析思维,是分析思维的引申应用。再优秀的思考方式,都需要佐证和证明,数据就是派这个用处的,「不是我觉得,而是数据证明」。

现代管理学之父彼得·德鲁克说过一句很经典的话:如果你不能衡量它,那么你就不能有效增长它。如果把它应用在数据领域,就是:如果你不能用指标描述业务,那么你就无法有效增长它。每一位数据分析师都要有指标体系的概念,报表也好,BI也好,即使机器学习,也是围绕指标体系建立的。

下图就是一个典型的指标体系,描述了用户从关注产品、下载、乃至最后离开的整个环节。每一个环节,都有数据及指标以查询监控。

不同业务背景需要的指标体系不同,但有几个建立指标的通用准则。这篇文章深入介绍了「如何建立数据分析的思维框架」。你将区分什么是好指标、什么是坏指标、比率和比例、指标的结构、指标设立的维度等概念。

数据分析不是一个结果,而是一个过程。几乎所有的分析,最终目的都是增长业务。所以比分析思维更重要的是驱动思维落地,把它转化为成果。

数据分析思维是常年累月养成的习惯,一周时间很难训练出来,但这里有一个缩短时间的日常习惯。以生活中的问题出发做练习。

这家商场的人流量是多少?怎么预估?

上海地区的共享单车投放量是多少?怎么预估?

街边口的水果店,每天的销量和利润是多少?怎么预估?

这些开放性问题起源于咨询公司的训练方法,通过不断地练习,肯定能有效提高分析思维。另外就是刷各种CaseBook。

优秀的数据分析师会拷问别人的数据,而他本身的分析也经得起拷问。

第四part:数据库

Excel很容易遇到瓶颈,随着业务的发展,分析师接触的数据会越来越多。对大部分人的电脑,超过十万条数据,已经会影响性能。何况大数据时代就是不缺数据,这时候就需要学习数据库了。

即使非数据岗位,也有越来越多的产品和运营被要求使用SQL。

很多数据分析师戏称自己是跑SQL的,这间接说明SQL在数据分析中有多核心。从Excel到SQL绝对是处理效率的一大进步。

教程内容以MySQL为主,这是互联网行业的通用标准。其实语法差异不大的。

新手首先应该了解表的概念,表和Excel中的sheet类似。「写给新人的数据库指南」是一篇入门基础文章,包括表、ID索引、以及数据库的安装,数据导入等简单知识。

SQL的应用场景,均是围绕select展开。增删改、约束、索引、数据库范式均可以跳过。新手在「SQL,从入门到熟练」教程会学习到最常见的几个语法,select、where、group by、if、count/sum、having、order by、子查询以及各种常用函数。

数据还是分析师薪资数据,它可以和Excel实战篇结合看,不少原理都是相通的。

想要快速掌握,无非是大量的练习。大家可以在leetcode上做SQL相关的练习题,难度从简单到困难都有。「SQL,从熟练到掌握」教程中将会带领大家去刷一遍。

join对新手是一个很绕的概念,教程会从图例讲解,逐步提高难度。从一开始的join关联,到条件关联、空值匹配关联、子查询关联等。最后完成leetcode中的hard模式。

如果想要更进一步,可以学习row_number,substr,convert,contact等函数。不同数据平台的函数会有差异,例如Presto和phpMyAdmin。再想提高,就去了解Explain优化,了解SQL的工作原理,了解数据类型,了解IO。知道为什么union比or的效率快,这已经和不少程序员并驾齐驱。

第五part:统计学

很多数据分析师并不注重统计学基础。

比如产品的AB测试,如果相关人员不清楚置信度的含义和概念,那么好的效果能意味着好么?如果看待显著性?

比如运营一次活动,若不了解描述统计相关的概念,那么如何判别活动在数据上的效果?可别用平均数。

不了解统计学的数据分析师,往往是一个粗糙的分析师。如果你想要往机器学习发展,那么统计学更是需要掌握的基础。

统计知识会教大家以另一个角度看待数据。如果大家了解过《统计数据会撒谎》,那么就知道很多数据分析的决策并不牢靠。

在第一篇教程「解锁数据分析的正确姿势:描述统计」,会教给大家描述统计中的诸多变量,比如平均数、中位数、众数、分位数、标准差、方差。这些统计标准会让新手分析师从平均数这个不靠谱的泥潭中出来。

箱线图就是描述统计的大成者,好的分析师一定是惯用箱线图的常客。

第二篇「解锁数据分析的正确姿势:描述统计(2)」将会结合可视化,对数据的分布进行一个直观的概念讲解。很多特定的模型都有自有的数据分布图,掌握这些分布图对分析的益处不可同日而语。

直方图和箱线图一样,将会是长久伴随分析师的利器。

统计学的一大主要分支是概率论,概率是度量一件事发生的可能性,它是介于0到1之间的数值。很多事情,都可以用概率论解释,「概率论的入门指南」和「读了本文,你就懂了概率分布」都是对其的讲解。

包括贝叶斯公式、二项概率、泊松概率、正态分布等理论。理论不应用现实,那是无根之木,教程中会以运营活动最常见的抽奖概率为讲解,告诉大家怎么玩。

其实数据分析中,概率应用最广泛和最全面的知识点,就是假设检验,大名鼎鼎的AB测试就是基于它的。俗话说得好,再优秀的产品经理也跑不过一半AB测试。

何为假设检验?假设检验是对预设条件的估计,通过样本数据对假设的真伪进行判断。

产品改版了,用户究竟喜不喜欢?调研的评分下降了,这是用户的评价降低了,还是正常的数据波动呢?这些都是可以做假设检验的。它可以说是两面两篇文章的回顾和应用。

「数据分析必须懂的假设检验」依旧以互联网场景讲解各种统计技巧的应用。假设检验并不难,通过Excel的几个函数就能完成。它的难点在于诸多知识点和业务的结合使用,实际公式不需要掌握的多透彻,了解背后的意义更重要。

统计学是一个很广阔的领域,包括方差分析,时间序列等,都有各自不同的应用。大家若感兴趣,可以去阅读各类教材,没错,教材是学习统计学最优的方式。我这类文章堪堪算入门罢了。

第六part:业务

对于数据分析师来说,业务的了解比数据方法论更重要。举个例子,一家O2O配送公司发现在重庆地区,外卖员的送货效率低于其他城市,导致用户的好评率降低。总部的数据分析师建立了各个指标去分析原因,都没有找出来问题。后来在访谈中发觉,因为重庆是山城,路面高低落差比较夸张,很多外卖人员的小电瓶上不了坡…所以导致送货效率慢。这个案例中,我们只知道送货员的送货水平距离,根本不知道垂直距离。这是数据的局限,也是只会看数据的分析师和接地气分析师的最大差异。业务形态千千万万,数据分析师往往难窥一二。我的公众号业务部分也涉及了不少,大家可以通过这几篇文章了解。

一篇文章读懂活跃数据;深入浅出,用户生命周期的运营;获取新增用户,运营都应该知道的事;运营的商业逻辑:CAC和CLV;从零开始,构建数据化运营体系;读懂用户运营体系:用户分层和分群,这些都是互联网运营相关的内容,或多或少涉及了不少业务方面的概念,数据分析人员可以选择性的挑选部分内容。了解业务的数据分析师在职场发展上会更加顺利。

而在「最用心的运营数据指标解读」中,我尝试总结了几个泛互联网领域的指标和业务模型,它们都是通用的框架。

产品运营模型:以移动端APP为主体,围绕AARRR准则搭建起数据框架。包括Acquisition用户获取、Activation用户活跃、Retention用户留存、Revenue营收、Refer传播,以及细分指标。

市场营销模型:以传统的市场营销方法论为基底,围绕用户的生命周期建立框架。包括用户生命周期,生命周期价值、用户忠诚指数、用户流失指数、用户RFM价值等。

流量模型:从早期的网站分析发展而来,以互联网的流量为核心。包括浏览量曝光率、病毒传播周期、用户分享率、停留时间、退出率跳出率等。

电商和消费模型:以商品的交易、零售、购买搭建而起。包括GMV、客单价、复购率、回购率、退货率、购物篮大小、进销存,也包含SKU、SPU等商品概念。

用户行为模型:通过用户在产品功能上的使用,获得精细的人群维度,以此作为分析模型。包括用户偏好、用户兴趣、用户响应率、用户画像、用户分层,还包含点赞评论浏览收藏等功能的相关指标。

除了上述的几个常见模型,数据分析还有其他分支。比如SEO/SEM,虽然可以归类到流量模型,但它并不简单。比如财务分析,商业的各种成本支出也需要专人负责。

在业务知识外,业务层面的沟通也很重要。业务线足够长的时候,沟通往往成为老大难的问题。

业务学习没有捷径,哪怕掌握了诸多模型,不同行业间的业务壁垒会是分析师们的门槛。金融的各类专有领域知识,电子商务不同产品的特性,这些都会影响到分析报告的质量。

在早期,新人最好选择一到两个领域深入了解其业务,然后以此拓展边界。

第七part:Python/R

第七周是最后的学习环节。

是否具备编程能力,是初级数据分析和高级数据分析的风水岭。数据挖掘、BI、爬虫、可视化报表都需要用到编程。掌握一门优秀的编程语言,可以让数据分析师升职加薪,迎娶白富美。数据分析领域最热门的两大语言是R和Python。R的优点是统计学家编写的,缺点也是统计学家编写。涉及各类统计函数和工具的调用,R无疑有优势。但是大数据量的处理力有不逮,学习曲线比较陡峭。

Python则是万能的胶水语言,适用性强,可以将分析的过程脚本化。Pandas、Numpy、SKLearn等包也是非常丰富。

这里的教程以Python为主。

「开始Python的新手教程」将会教大家搭建数据分析环境,Anaconda是功能强大的数据科学工具。Python建议安装Python3+版本,不要选择Python2了。

Python的语法相当简洁,大家print出第一个hello world顶多半小时。就像在Excel上进行运算一样方便。

「开始Python的数据结构」介绍给大家Python的三类数据结构,列表list,元组tuple,以及字典dict。万变不离其宗,掌握这三种数据结构以及相对应的函数,足够应付80%的分析场景。函数式编程为Python一大特色,Python自身就提供不少丰富的函数。很多都和Excel的函数相通,掌握起来非常迅速。另外还有控制流,for、while、if,通常配合函数组合使用。

「了解和掌握Python的函数」教大家如何自定义函数,丰富的函数虽然能偷懒,但是不少场景下,还是需要自己动手撸一个。

能够调第三方包解决,就使用第三方的函数。如果是一个频繁使用的场景,而第三方依靠不了,就自己编一个函数。如果是临时性的场景,写得粗糙点也无所谓。毕竟分析师的代码能力不要求工程师那么严格,所以Python的学习尽量以应用为主,不用像分析师那么严格。

包、模块和类的概念属于进阶知识,不学也不要紧。

「Python的数据分析: numpy和pandas入门」介绍了数据分析师赖以生存的两个包,numpy和pandas,其他Python知识可以不扎实,这两个最好认真掌握。它是往后很多技能树的前置要求。

array,series,dataframe是numpy和pandas的三个数据结构,掌握它们,便算是入门了。后续的两篇教程都是实战。

「用pandas进行数据分析实战」以分析师的薪资作为实战数据。Excel、BI、SQL,一路走来,大家想必对它无比熟悉,这也是最后一次使用它了。教程通过Pandas的各类功能,绘制出一副词云图。

最后一篇教程,将结合以往的知识点,包括业务指标,可视化,描述统计学等内容。「用Python分析用户消费行为」,完成它,不说登堂入室,但也是一位合格的数据分析师了。

它使用某网站的用户消费数据,计算各类常见指标:用户的客单价、人均购买量、回购率、复购率、留存率、平均生命周期等,真正做到融会贯通。用一份数据报告作为毕业作品,也是七周系列最好的结业证书了。

对于没有技术基础的同学,第七part最吃力,但已经完成到这一步,不妨让自己咬咬牙学习下去。

最后

如果能够看完到这里的同学,相信你是对数据分析真正感兴趣的。

7. 做互联网产品还是运营更有前景?

运营的价值在哪里?

很多人眼中,运营就是打杂跑腿,琐事缠身,各种出卖体力。

这其实没错,因为至少超过80%的运营,其工作状态确实如此。

然而,在很多过来人的眼中,以及很多CEO、创始人们的眼中,运营的真正价值所在,却绝不是“可以管理好各种琐事,具备强大的执行力”这么简单。

具体来说,运营的复杂度体现在如下几方面——

一款产品,因其业务类型的差异,其运营过程中核心关注点是不一样的(如,高频使用型产品和低频使用型产品、消费型产品和非消费型产品就完全不同);

一款产品,因其产品形态的差异,其运营体系的搭建以及其运营通路也是完全不同的(如,工具类产品与社交类产品、内容型产品与平台型产品);

一款产品,依其发展所处的不同阶段,每一阶段的运营侧重点也千差万别(如,一款成熟型的产品和一款刚上线的早期产品,运营要解决的问题基本也完全不一样);

即便目标和运营侧重点完全一致,为了实现同一个目的,运营上具体可以采用的手段也是多种多样的(如,为了搞定10W新增用户,我可以策划个事件,可以做效果广告投放,也可以发一堆软文……)。

基本上,一个初中阶运营和一个高阶运营间最常见的分水岭,也在于前者只能关注执行,后者则具备能力去完成策略制定、更长线的运营方案规划、以及运营操盘、运营手段。这基本也往往是一个所谓“运营经理”和“运营总监”之间的区别了。

纵览整个互联网世界,我觉得,绝大部分产品的运营工作如何规划,都可以从两个维度,一是商业逻辑,二是典型用户行为频次来评估。

商业逻辑

普遍来看,各类互联网产品大体存在以下3种商业逻辑,而每种商业逻辑反向回来对于运营端的要求又会有所不同。

商业逻辑1:直接面向用户售卖某种商品或服务获得盈利

这样的产品商业逻辑最为直接,它们存在的目的就是为了把某些商品或服务直接销售给用户,并从中获利。

它们当中的典型例如品牌电商网站,各种O2O上门服务等。

所以,它的核心在于:是否能找到足够好足够多的商品,以足够低的成本足够顺畅的将其售卖出去,并确保整体售卖流程的顺畅程度。

例:唯品会、聚美优品、当当网等自营电商,运营端往往会被划分成几个子团队—

✔ 品类运营

✔ 商品运营

✔ 供应链团队

✔ 营销团队

商业逻辑2:免费+增值服务

该类产品的商业逻辑是:我为用户免费提供一部分产品或服务,在此基础上通过一部分付费增值服务获得盈利。

这样的产品在互联网世界里是颇为常见的,尤其常见于各类工具类产品(比如我现在在用的印象笔记)。它们往往通过免费提供某种服务从而赢得大量用户,之后再通过提供付费增值服务的方式实现盈利。

所以,其核心在于:是否能获取到足够多的用户,是否能够让用户对产品形成依赖,以及是否可以更顺利的撬动用户为增值服务买单。

这里举一个典型例子,印象笔记这款产品,从2012年进入国内开始一直到2014年成功成为最大的笔记类应用期间,前后重点做了这么几件事—

初期,不断通过广告片、软文、演讲分享等等形式对外传递类似信息:“你需要有一个第二大脑去帮助你把那些需要记忆的东西储存起来,然后把你的大脑主要用于思考,这样你的个人价值才能最大化”。

然后,慢慢找到一群“知识界大V”成为其典型标杆用户,

最后,通过官方组织或鼓励民间等各种方式先后发起和组织了N多活动,类似“一起记晨间日记”,“月度目标大挑战”等等之类的。

商业逻辑3:免费+流量or数据变现

该类产品的商业逻辑是:通过为用户提供产品或服务,慢慢积累起海量访问流量或数据、然后再基于已有的流量和数据通过引入有付费意愿的第三方实现变现(即售卖流量,售卖数据等)。

而这一逻辑的核心往往在于:是否能获取到足够多的用户,用户忠诚度是否足够,是否能积累下来可以持续带来新流量的数据或内容,是否可以积累下来付费方愿意为之付费的内容、数据或是特定氛围。

例:知乎作为一个社区的代表,从2011年上线以来,其站内的运营始终是围绕着以下几个点来做的——

如何搭建好一个特定的氛围。

优质内容、数据等的积淀。

核心用户(知乎大V)的维系。至今都跟知乎官方保持着密切的关系,会有人定期与他们进行沟通,并邀请他们参加各类活动。

变现尝试。知乎积累下来的最有价值的东西就是“人”和“内容”,所以知乎的变现也一直在围绕着这两者在进行着,包括但不限于出版、最近刚刚上线的“值乎”、“知乎Live”、知乎产品的品牌广告展示(但品牌会经过挑选,且广告内容必须是与“知识”相关的内容)等。

典型用户行为频次

所谓典型用户行为频次,就是假如用户接受和认可了你,ta使用你最核心的产品功能或服务的频次可能是怎样的。这会导致我们在关于用户获取方面要关注的重点会发生一些变化

用户一次性使用

这种类型的典型产品比如某些培训课程(如托福雅思),或婚庆服务,殡葬服务等。且毫无疑问,该类产品肯定是收费型的产品(用户一次性使用,还免费,那还做个毛)......

因为用户接受并使用该服务的机会基本只有一次,所以该类产品基本不用考虑花太多精力在用户维系方面。相反,该类产品更应该关注的事情,一定是:

获客渠道的铺设和广告投放;

销售转化的有效性;

客单价(就一次挣钱的机会,当然要挣足点儿啊……)。

总之,推广上要舍得花钱,只要最终的ROI能算平,怎么花都行。

用户中低频次使用(如数月一次,甚至1-2年一次)

这种类型的典型产品比如汽车保养类产品、求职类产品等。

该类产品的特点是:不管用户多喜欢你多认可你,他每次使用完你,基本就走掉了,且距离下次他再使用你时间周期会比较漫长。

所以,该类产品在用户获取方面如果都依靠花钱投放和推广的话,一定亏死了……

相对而言,他们更需要的,是能够让用户每次产生相关需求时,都能够最快捷最有效的找到他们。

那么,类似求职找工作这样的事,用户在每次产生相关需求时,关于到底使用什么产品是如何决策的呢?

基本上有很大可能取决于如下几点——

我脑海中第一时间出现的在这个领域内的品牌是哪家?

我最近是否听到过身边有人提过或推荐过某款相关产品?

我通过搜索引擎、应用商店等渠道搜索“招聘运营总监”等相关关键字,看看会出来哪些结果?

于是,对于该类型的产品在用户获取方面更应该关注些什么,看起来也就很清晰了吧?

基本上,无外乎—

渠道铺设,占据入口。如搜索引擎、应用商店等地方,该占据的位置一定要占据,且能排得越靠前越好;

品牌传播,占据认知。不断通过活动、事件、媒体报道、PR软文等各种方式面向行业和用户去传播你的品牌,提升大家对于你品牌的认知。

用户高频次使用(至少每周一次)

这类产品就很多了,比如阅读类产品、社交类产品等等,都算。

该类产品的特点往往是:用户从了解你到接受你再到认可你,可能需要一点周期,但一旦ta真的接受了你,ta就会变得很难再离开你。

另外,该类产品因为用户使用的频次比较高,所以理论上产生口碑效应和病毒营销的概率也最大。

所以,毋庸置疑,这类产品需要关注的重点往往是以下两个——

通过补贴、活动、运营机制、用户引导等各种方式培养用户的使用习惯(如上面提到的印象笔记案例,再如滴滴和各种外卖类应用早期不断给用户发红包,都是为了培养使用习惯);

在用户获取方面,更应该思考如何通过运营机制或运营手段撬动现有用户的力量,打通几个“分享”的场景,形成病毒传播和增长(如滴滴和外卖类应用的“红包”,如各种美图类应用的“变妆”H5小游戏、美妆比赛等)。

本文标签:

很赞哦! ()

横幅广告