Skip to content

Files

Latest commit

c5fb9b2 · Oct 12, 2019

History

History
180 lines (97 loc) · 6.51 KB

week26.md

File metadata and controls

180 lines (97 loc) · 6.51 KB

Algorithm、Review、Tip、Share 简称ARTS

1.每周至少做一个 leetcode 的算法题 2.阅读并点评至少一篇英文技术文章 3.学习至少一个技术技巧 4.分享一篇有观点和思考的技术文章

Tip

INSERT IGNORE 如何处理有2个唯一索引的情况

只有违背一个唯一索引,这个记录就不会插入

INSERT IGNORE openaccount_external_user (channel,user_id,unionid,appid,openid) VALUES(?,?,?,?,?)
UNIQUE KEY `channel` (`channel`,`user_id`)
UNIQUE KEY `appid` (`appid`,`openid`)

接口设计

接口返回值能够告诉接口调用者下一步怎么做。 会更好维护。 实战总结经验

* 判断是否绑定

请求路径:

返回参数:
{
    "need_bind": <bool>	// need_bind,binded,cannot_bind。 
    "unionid_exist": <bool>	// fwh|thb
}

https://www.cnblogs.com/sui776265233/p/9772803.html 十、Hypermedia API

<赤裸裸的统计学>

中心极限定理

一个经验值: 样本数量必须到达30,中心极限定理才能保证成立。

  • 中心极限定理通俗介绍
  1. Q: 现在我们要统计全国的人的体重,看看我国平均体重是多少。

  2. 用实际数据来展示中心极限定理:掷骰子

  3. 实际应用

在实际生活当中,我们不能知道我们想要研究的对象的平均值,标准差之类的统计参数。 中心极限定理在理论上保证了我们可以用只抽样一部分的方法,达到推测研究对象统计参数的目的。 在上文的例子中,掷骰子这一行为的理论平均值3.5是我们通过数学定理计算出来的。而我们在实际模拟中,计算出来的样本平均值的平均值(3.48494)确实已经和理论值非常接近了。

https://blog.csdn.net/mingyuli/article/details/81141758

标准误差 和 标准差

标准差 用来衡量数据的离散程度,或者说数据的波动大小。

标准误差 用来衡量抽样误差的大小。

https://zhidao.baidu.com/question/139164869289007605.html

回归分析

如果处理得当,回归分析能够排除其他因素的影响,辅助我们认清幼儿园对孩子升入小学后的影响。

最小二乘法

最佳拟合回归线: y = a + xb

<深入浅出统计学>

13 假设检验

  • 原假设,备择假设

Q:在统计学中,假设检验中的显著性水平的意义是什么?

A: 显然假设不成立的概率大小。

https://www.zhihu.com/question/31615254/answer/149397914

推论统计

推论统计(inferential statistics)是借助抽样调查,从局部推断总体,以对不肯定的事物做出决策的一种统计。 有总体参数估计假设检验 两种。

https://baike.baidu.com/item/%E6%8E%A8%E8%AE%BA%E7%BB%9F%E8%AE%A1#ref_[1]_334067

数据埋点

  • 数据埋点文档的定义规范
  1. 埋点事件类型分类: 点击事件表、曝光事件表、停留事件表

  2. 每个埋点的字段: 页面+页内位置+事件类型(点击,曝光,停留)+事件ID+ 事件的一些属性值(k:v) + 记录规则(上报时机) + 备注 // 上线时间

事件ID的命名规范:事件英文简写_哪一端的产品_产品名称简写_页面名称_模块名称_功能名称。

http://www.woshipm.com/data-analysis/872543.html

  • 产品的埋点方案设计

http://www.woshipm.com/data-analysis/879349.html

  • 基于推断统计学,把握问题核心洞悉数据模式与趋势

http://www.woshipm.com/data-analysis/886082.html

  • 可视化数据流量地图

http://www.woshipm.com/data-analysis/894519.html

  • 如何写一份高质量的埋点文档

https://www.jianshu.com/p/b791a7b37326

其他涉猎

Titanic初试身手

  • 第五步:模型选择
  1. sciket-learn算法选择的决策图.

  2. 我们的任务是预测乘客是否能幸存,很明显是一个基本的二分类问题(Binary Classification)。 可以用来处理二分类问题的模型主要有:感知机、Logistic回归、决策树、SVM和随机森林等

https://zhuanlan.zhihu.com/p/29086614

文本分类: Toxic评论分类挑战赛

最基本的文本分类问题解决方案:Logistic Regression、TF-IDF

https://zhuanlan.zhihu.com/p/33925599?edition=yidianzixun&utm_source=yidianzixun&yidian_docid=0IOif9d0

https://www.kaggle.com/yekenot/toxic-regression/code

如何理解最小二乘法?

  • 因为误差是长度,还要取绝对值,计算起来麻烦,就干脆用平方来代表误差:

  • 这是一个二次函数,对其求导,导数为0的时候取得最小值

  • 所谓“二乘”就是平方的意思,台湾直接翻译为最小平方法。

** 最小二乘法与正态分布 **

https://blog.csdn.net/ccnt_2012/article/details/81127117

Share

  • 自己的思考:
  1. 为什么这世上没有学不会的知识

我读大学时,有一个公认很聪明的大学老师,并且的他的教学过程设计得也很别致,以实践为中心,兼顾理论的学习。 有一次他提到了他有这样一个习惯。当他看书时遇到怎么看都看不懂的知识点时,他认为是作者写得不太好,就会换几本书看,总有一个作者的讲解让他豁然开朗。 于是他建议,我们在看书的过程中遇到不懂的问题时,也可以换本书试试。

后来,我的学习和工作生涯中,我也会有意无意使用这个技巧,感觉收益颇多。收益于这个技巧,至少我对绝大部分知识都没有畏难心理,很多知识,只要不畏惧了,基本上都学得会。

上述是我的亲身经历,是大学时候的一个经历,可能说服力不够。 其实华罗庚先生也提到过一个类似的学习技巧,我记得是在<厚薄读书法>中提到的。在把书读厚的阶段,如果遇到不懂的问题,就要多问其他人,多查看资料,基本上都可以把这个问题搞懂的. 这其实也是一样的道理,没有什么不能理解的知识点,只是你问错了人,用了错误的角度来理解.

甚至,更进一步, 大家应该知道费曼技巧,不管多复杂的知识点,总是可以被更简单的话讲述明明白白的。 并且从学习和工作中,我能都有这样的经验:聪明的人,基本上都可以用简单明了的几句话就可以事情说清楚。

  1. 为什么我说人的认知模型是不同的。

在学习的过程中,对于同一个知识点,有些同学可以理解,有些同学不能理解,但是基本上大部分知识点,不理解的同学经过一段时间之后都会理解了。 从不理解->理解这个过程中,这些同学受到了接收到了哪些信息呢。

  1. 如何说服别人,影响别人的认知呢?