useful or useless tips
- close vmware service and install unlocker208 so vmware can recognize mac series os
- it is a pity that .iso may not be supported, only .cdr is supported, which should be generated from .dmg
- after setting mac vm, open vm dic and find .vmx, after
smc.present = "TRUE"
addsmc.version = 0
- then it may be easier to finish the installation
- after getting into mac vm, it may be slow, download beamoff and install it to address the problem
- 中央研究院近代汉语标记语料库:http://www.sinica.edu.tw/Early_Mandarin/ ???
- 中央研究院汉籍电子文献(瀚典全文检索系统)http://www.sinica.edu.tw/ftms-bin/ftmsw3 ???
- 国家现代汉语语料库:http://124.207.106.21:8080/ 404
- 国家语委现代汉语语料库:http://www.clr.org.cn/retrieval/index.html 404
- 树图数据库:http://treebank.sinica.edu.tw/ 繁中
- 语料库语言学在线:http://corpus4u.org 论坛
- 北京大学中国语言学研究中心,简称CCL语料库检索系统(包括:现代汉语语料库、古代汉语语料库、汉英双语语料库)http://ccl.pku.edu.cn/Yuliao_Contents.Asp 404
- 北京大学《人民日报》标注语料库:http://www.icl.pku.edu.cn ???
- 北京语言大学的语料库:http://www.blcu.edu.cn/kych/H.htm 404
- 清华大学的汉语均衡语料库THACorpus:http://www.lits.tsinghua.edu.cn/ainlp/source.htm ???
- 山西大学语料库:http://www.sxu.edu.cn/homepage/cslab/sxuc1.htm 404
- 台湾南岛语典藏:http://www.ling.sinica.edu.tw/Formosan/ 404
- 闽南语典藏:http://southernmin.sinica.edu.tw/ 404
- 香港城市大学的LIVAC共时语料库:http://www.rcl.cityu.edu.hk/livac/ ??? 或 http://www.LIVAC.org 繁中
- 浙江师范大学的历史文献语料库:http://lib.zjnu.net.cn/xueke/hyywzx/xkjj.htm 404
- 中国科学院计算所的双语语料库:http://mtgroup.ict.ac.cn/corpus/query_process.php 404
- 中文语言资源联盟:http://www.chineseldc.org/xyzy.htm 404
- 红楼梦汉英平行语料库:http://score.crpp.nie.edu.sg/hlm/index.htm# ???
- SKETCHENGINE多语言语料库:www.sketchengine.co.uk
- LIVAC共时语料库:http://www.livac.org/ 繁中
- CCL汉英双语语料库检索:http://ccl.pku.edu.cn:8080/ccl_corpus/index_bi.jsp
Corpus of Contemporary American English (COCA) 400 million words 1990 - 2009 Corpus of Historical American English (COHA; Summer 2009 beta) 400 million words 1810s - 2000s BYU-BNC: British National Corpus 100 million words 1980s - 1993 TIME Corpus of American English 100 million words 1920s - 2000s BYU-OED: Oxford English Dictionary 37 million words 1000s - 2000s Corpus del Español 100 million words 1200s - 1900s Corpus do Português 45 million words 1300s - 1900s
def getUrl_multiTry(url):
user_agent ='"Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/38.0.2125.122 Safari/537.36"'
headers = { 'User-Agent' : user_agent }
maxTryNum=10
for tries in range(maxTryNum):
try:
req = urllib2.Request(url, headers = headers)
html=urllib2.urlopen(req).read()
break
except:
if tries <(maxTryNum-1):
continue
else:
logging.error("Has tried %d times to access url %s, all failed!",maxTryNum,url)
break
return html
- Mecabのインストール
sudo apt-get install mecab mecab-ipadic-utf8
- swigとlibmecab-devのインストール
sudo apt-get install swig
sudo apt-get install libmecab-dev
- mecab-python-0.996のインストール
sudo ldconfig
印象中用notepad写java是很久以前的事了,99%以上的情况都是用些workbench。最近想试试最原始的,可是忽略了一个非常微小的细节以致于运行失败。务必要记住,在写环境变量CLASSPATH的时候最后一定要加分号,像这样:
%JAVA_HOME%\lib;%JAVA_HOME%\lib\tools.jar;
最后的那个分号一定不能漏
Tag | Description | Example | Tag | Description | Example |
---|---|---|---|---|---|
a | adjective | 美丽 | ni | organization name | 保险公司 |
b | other noun-modifier | 大型, 西式 | nl | location noun | 城郊 |
c | conjunction | 和, 虽然 | ns | geographical name | 北京 |
d | adverb | 很 | nt | temporal noun | 近日, 明代 |
e | exclamation | 哎 | nz | other proper noun | 诺贝尔奖 |
g | morpheme | 茨, 甥 | o | onomatopoeia | 哗啦 |
h | prefix | 阿, 伪 | p | preposition | 在, 把 |
i | idiom | 百花齐放 | q | quantity | 个 |
j | abbreviation | 公检法 | r | pronoun | 我们 |
k | suffix | 界, 率 | u | auxiliary | 的, 地 |
m | number | 一, 第一 | v | verb | 跑, 学习 |
n | general noun | 苹果 | wp | punctuation | ,。! |
nd | direction noun | 右侧 | ws | foreign words | CPU |
nh | person name | 杜甫, 汤姆 | x | non-lexeme | 萄, 翱 |
- 下载flash for linux(tar.gz)并解压
- libflashplayer.so放到usr/lib/firefox-addons/plugins
- Launcher置于底部:
gsettings set com.canonical.Unity.Launcher launcher-position Bottom
- 点击Luancher上的图标完成放大缩小:
gsettings set org.compiz.unityshell:/org/compiz/profiles/unity/plugins/unityshell/ launcher-minimize-window true
- JDK:
sudo add-apt-repository ppa:webupd8team/java
sudo apt-get update
sudo apt-get install oracle-java8-installer
- sublime text3:
sudo add-apt-repository ppa:webupd8team/sublime-text-3
sudo apt-get update
sudo apt-get install sublime-text
- 经典菜单指示器:
sudo add-apt-repository ppa:diesch/testing
sudo apt-get update
sudo apt-get install classicmenu-indicator
- 系统指示器SysPeek:
sudo add-apt-repository ppa:nilarimogard/webupd8
sudo apt-get update
sudo apt-get install syspeek
-
vim、git、vpnc、axel
-
摆放桌面图标:
sudo cp /usr/share/applications/*.desktop ~/桌面
cd ~/桌面
sudo chown 当前登录用户 *.desktop
chmod a+x *.desktop
-
从github的chokkann上把liblbfgs和crfsuite弄下来
-
apt装libtool、m4、automake、autoconf(如果没装的话)
-
装liblbfgs
cd liblbfgs
./autogen.sh
./configure
make && make install
- 装crfsuite
cd crfsuite
./autogen.sh
./configure
make && make install
-
装python-dev或python3-dev(如果没装的话)
-
装crfsuite-python
cd swig/python/
./prepare.sh
python setup.py build_ext --include-dir=/usr/local/include --library-dirs=/usr/local/lib -R /usr/local/lib
python setup.py install
-
国会会議検索システム:http://kokkai.ndl.go.jp
-
茶漉一般公開サイト:http://telldev.cla.purdue.edu/chakoshi/public.html
mpi-default-dev libicu-dev python-dev python3-dev libbz2-dev zlib1g-dev
./bootstrap.sh --with-toolset=clang
./b2 install --build-type=complete --layout=versioned threading=multi --prefix="/usr/lib/boost-1.60"
export C_INCLUDE_PATH=/usr/lib/boost-1.60/include/boost-1_60:$C_INCLUDE_PATH
export CPLUS_INCLUDE_PATH=/usr/lib/boost-1.60/include/boost-1_60:$CPLUS_INCLUDE_PATH
export LD_LIBRARY_PATH=/usr/lib/boost-1.60/lib:$LD_LIBRARY_PATH
export LIBRARY_PATH=/usr/lib/boost-1.60/lib:$LIBRARY_PATH
-
Cygwin:http://www.cygwin.com/
-
设置环境变量
-
安装python2、python3
-
检查4个环境变量
-
进到python3下目录,python.exe更名为python3.exe
-
删除python3下script下的pip.exe
-
用户文件夹下新建pip文件夹,pip下新建pip.ini,添加:
[global]
index-url=http://pypi.douban.com/simple
trusted-host=pypi.douban.com
disable-pip-version-check=true
timeout=120 -
输入
python -V
python3 -V
pip -V
pip3 -V
测试 -
如果pip3有问题,则
python3 -m pip install -U pip
-
A搜索算法——图形搜索算法,从给定起点到给定终点计算出路径。其中使用了一种启发式的估算,为每个节点估算通过该节点的最佳路径,并以之为各个地点排定次序。算法以得到的次序访问这些节点。因此,A*搜索算法是最佳优先搜索的范例。http://theory.stanford.edu/~amitp/GameProgramming/AStarComparison.html
-
集束搜索(又名定向搜索,Beam Search)——最佳优先搜索算法的优化。使用启发式函数评估它检查的每个节点的能力。不过,集束搜索只能在每个深度中发现最前面的m个最符合条件的节点,m是固定数字——集束的宽度。
-
二分查找(Binary Search)——在线性数组中找特定值的算法,每个步骤去掉一半不符合要求的数据。
-
分支界定算法(Branch and Bound)——在多种最优化问题中寻找特定最优化解决方案的算法,特别是针对离散、组合的最优化。
-
Buchberger算法——一种数学算法,可将其视为针对单变量最大公约数求解的欧几里得算法和线性系统中高斯消元法的泛化。
-
数据压缩——采取特定编码方案,使用更少的字节数(或是其他信息承载单元)对信息编码的过程,又叫来源编码。
-
Diffie-Hellman密钥交换算法——一种加密协议,允许双方在事先不了解对方的情况下,在不安全的通信信道中,共同建立共享密钥。该密钥以后可与一个对称密码一起,加密后续通讯。
-
Dijkstra算法——针对没有负值权重边的有向图,计算其中的单一起点最短算法。
-
离散微分算法(Discrete differentiation)
-
动态规划算法(Dynamic Programming)——展示互相覆盖的子问题和最优子架构算法
-
欧几里得算法(Euclidean algorithm)——计算两个整数的最大公约数。最古老的算法之一,出现在公元前300前欧几里得的《几何原本》。
-
期望-最大算法(Expectation-maximization algorithm,又名EM-Training)——在统计计算中,期望-最大算法在概率模型中寻找可能性最大的参数估算值,其中模型依赖于未发现的潜在变量。EM在两个步骤中交替计算,第一步是计算期望,利用对隐藏变量的现有估计值,计算其最大可能估计值;第二步是最大化,最大化在第一步上求得的最大可能值来计算参数的值。
-
快速傅里叶变换(Fast Fourier transform,FFT)——计算离散的傅里叶变换(DFT)及其反转。该算法应用范围很广,从数字信号处理到解决偏微分方程,到快速计算大整数乘积。
-
梯度下降(Gradient descent)——一种数学上的最优化算法。
-
哈希算法(Hashing)
-
堆排序(Heaps)
-
Karatsuba乘法——需要完成上千位整数的乘法的系统中使用,比如计算机代数系统和大数程序库,如果使用长乘法,速度太慢。该算法发现于1962年。
-
LLL算法(Lenstra-Lenstra-Lovasz lattice reduction)——以格规约(lattice)基数为输入,输出短正交向量基数。LLL算法在以下公共密钥加密方法中有大量使用:背包加密系统(knapsack)、有特定设置的RSA加密等等。
-
最大流量算法(Maximum flow)——该算法试图从一个流量网络中找到最大的流。它优势被定义为找到这样一个流的值。最大流问题可以看作更复杂的网络流问题的特定情况。最大流与网络中的界面有关,这就是最大流-最小截定理(Max-flow min-cut theorem)。Ford-Fulkerson 能找到一个流网络中的最大流。
-
合并排序(Merge Sort)
-
牛顿法(Newton's method)——求非线性方程(组)零点的一种重要的迭代法。
-
Q-learning学习算法——这是一种通过学习动作值函数(action-value function)完成的强化学习算法,函数采取在给定状态的给定动作,并计算出期望的效用价值,在此后遵循固定的策略。Q-leanring的优势是,在不需要环境模型的情况下,可以对比可采纳行动的期望效用。
-
两次筛法(Quadratic Sieve)——现代整数因子分解算法,在实践中,是目前已知第二快的此类算法(仅次于数域筛法Number Field Sieve)。对于110位以下的十位整数,它仍是最快的,而且都认为它比数域筛法更简单。
-
RANSAC——是“RANdom SAmple Consensus”的缩写。该算法根据一系列观察得到的数据,数据中包含异常值,估算一个数学模型的参数值。其基本假设是:数据包含非异化值,也就是能够通过某些模型参数解释的值,异化值就是那些不符合模型的数据点。
-
RSA——公钥加密算法。首个适用于以签名作为加密的算法。RSA在电商行业中仍大规模使用,大家也相信它有足够安全长度的公钥。
-
Schönhage-Strassen算法——在数学中,Schönhage-Strassen算法是用来完成大整数的乘法的快速渐近算法。其算法复杂度为:O(N log(N) log(log(N))),该算法使用了傅里叶变换。
-
单纯型算法(Simplex Algorithm)——在数学的优化理论中,单纯型算法是常用的技术,用来找到线性规划问题的数值解。线性规划问题包括在一组实变量上的一系列线性不等式组,以及一个等待最大化(或最小化)的固定线性函数。
-
奇异值分解(Singular value decomposition,简称SVD)——在线性代数中,SVD是重要的实数或复数矩阵的分解方法,在信号处理和统计中有多种应用,比如计算矩阵的伪逆矩阵(以求解最小二乘法问题)、解决超定线性系统(overdetermined linear systems)、矩阵逼近、数值天气预报等等。
-
求解线性方程组(Solving a system of linear equations)——线性方程组是数学中最古老的问题,它们有很多应用,比如在数字信号处理、线性规划中的估算和预测、数值分析中的非线性问题逼近等等。求解线性方程组,可以使用高斯—约当消去法(Gauss-Jordan elimination),或是柯列斯基分解( Cholesky decomposition)。
-
Strukturtensor算法——应用于模式识别领域,为所有像素找出一种计算方法,看看该像素是否处于同质区域( homogenous region),看看它是否属于边缘,还是是一个顶点。
-
合并查找算法(Union-find)——给定一组元素,该算法常常用来把这些元素分为多个分离的、彼此不重合的组。不相交集(disjoint-set)的数据结构可以跟踪这样的切分方法。合并查找算法可以在此种数据结构上完成两个有用的操作:
查找:判断某特定元素属于哪个组。
合并:联合或合并两个组为一个组。
- 维特比算法(Viterbi algorithm)——寻找隐藏状态最有可能序列的动态规划算法,这种序列被称为维特比路径,其结果是一系列可以观察到的事件,特别是在隐藏的Markov模型中。
#中科大kali源
deb http://mirrors.ustc.edu.cn/kali sana main non-free contrib
deb http://mirrors.ustc.edu.cn/kali-security/ sana/updates main contrib non-free
deb-src http://mirrors.ustc.edu.cn/kali-security/ sana/updates main contrib non-free
#阿里云kali源
deb http://mirrors.aliyun.com/kali sana main non-free contrib
deb http://mirrors.aliyun.com/kali-security/ sana/updates main contrib non-free
deb-src http://mirrors.aliyun.com/kali-security/ sana/updates main contrib non-free
[].forEach.call($$("*"),function(a){a.style.outline="1px solid #"+(~~(Math.random()*(1<<24))).toString(16)})
http://www.sowang.com/link.htm
http://www.jianshu.com/p/ae7c8513bb00
-
ASCII:\u0000-\u007f
-
带有变音符号的拉丁文、希腊文、西里尔字母、亚美尼亚语、希伯来文、阿拉伯文、叙利亚文及马尔代夫语:\u0080-\u07ff
-
日式标点:\u3000-\u303f
-
平假名:\u3040-\u309f
-
片假名:\u30a0-\u30ff
-
全角标点和半宽片假名:\uff00-\uffef
-
中日韩unifed象形文字-汉字常见和罕见:\u4e00-\u9fa5
-
中日韩统一表意文字扩展区A -罕见汉字:\u3400-\u4dbf
中文汉字在utf-8中一般是3个字节,最常见的编码方式是1110xxxx 10xxxxxx 10xxxxxx
from PIL import Image
import argparse
parser = argparse.ArgumentParser()
parser.add_argument('file')
parser.add_argument('-o','--output')
parser.add_argument('--width',type = int ,default = 272)
parser.add_argument('--height',type = int, default = 160)
args = parser.parse_args()
IMG = args.file
WIDTH = args.width
HEIGHT = args.height
OUTPUT = args.output
ascii_char = list("$@B%8&WM#*oahkbdpqwmZO0QLCJUYXzcvunxrjft/\|()1{}[]?-_+~<>i!;:,\"^`'.")
def get_char(r,b,g,alpha = 256):
if alpha == 0:
return ' '
length = len(ascii_char)
gray = int(0.2126*r+0.7152*g+0.0722*b)
unit = (256.0+1)/length
return ascii_char[int(gray/unit)]
if __name__ == '__main__':
im = Image.open(IMG)
im = im.resize((WIDTH,HEIGHT),Image.NEAREST)
txt = ""
for i in range(HEIGHT):
for j in range(WIDTH):
txt += get_char(*im.getpixel((j,i)))
txt += '\n'
print txt
if OUTPUT:
with open(OUTPUT,'w') as f:
f.write(txt)
else:
with open("output.txt",'w') as f:
f.write(txt)
Gray = R * 0.299 + G * 0.587 + B * 0.114
Gray = (R*1 + G*2 + B*1) >> 2
Gray = (R*2 + G*5 + B*1) >> 3
Gray = (R*4 + G*10 + B*2) >> 4
Gray = (R*9 + G*19 + B*4) >> 5
Gray = (R*19 + G*37 + B*8) >> 6
Gray = (R*38 + G*75 + B*15) >> 7
Gray = (R*76 + G*150 + B*30) >> 8
Gray = (R*153 + G*300 + B*59) >> 9
Gray = (R*306 + G*601 + B*117) >> 10
Gray = (R*612 + G*1202 + B*234) >> 11
Gray = (R*1224 + G*2405 + B*467) >> 12
Gray = (R*2449 + G*4809 + B*934) >> 13
Gray = (R*4898 + G*9618 + B*1868) >> 14
Gray = (R*9797 + G*19235 + B*3736) >> 15
Gray = (R*19595 + G*38469 + B*7472) >> 16
Gray = (R*39190 + G*76939 + B*14943) >> 17
Gray = (R*78381 + G*153878 + B*29885) >> 18
Gray = (R*156762 + G*307757 + B*59769) >> 19
Gray = (R*313524 + G*615514 + B*119538) >> 20
Gray = (R^2.2 * 0.2973 + G^2.2 * 0.6274 + B^2.2 * 0.0753)^(1/2.2)
스프 | 调料 | 比例 |
---|---|---|
정제수 | 精制水 | |
간장 | 酱油 | |
정백당 | 精白糖 | |
치킨항분말 | 鸡肉香粉 | |
대두유 | 大豆油 | |
하바네로맛시즈닝 | 哈瓦那辣椒调味料 | |
매운고추베이스분말 | 火辣椒(Capsicum annuum)香精粉 | |
양파 | 洋葱 | |
지미강화육수분말 | 强化肉汤粉 | |
마늘 | 大蒜 | |
변성전분 | 变性淀粉 | |
고추분 | 辣椒(Capsicum annuum)粉 | |
탈색칠리추출물 | 脱色辣椒(Chili)提取物 | |
파프리카추출물 | 辣椒(Paprika)提取物 | |
후추분 | 胡椒粉 | |
지킨카레맛베이스 | 鸡肉咖喱香精 | |
영양강화제 | 营养强化剂 |
configure.exe -qt-libjpeg -qt-zlib -qt-libpng -qt-libjpeg -qt-gif -no-libtiff -no-libmng -nomake examples -nomake demos -no-webkit -nomake doc -no-plugin-manifests -no-exceptions -no-rtti -no-qt3support -no-openssl -no-opengl -no-multimedia -no-3dnow -no-native-gestures -no-style-motif -no-style-cde -no-style-cleanlooks -no-style-plastique -no-sql-sqlite -no-dbus -platform win32-msvc2008
data = xlrd.open_workbook('excelFile.xls')
table = data.sheets()[0] #通过索引顺序获取
table = data.sheet_by_index(0) #通过索引顺序获取
table = data.sheet_by_name(u'Sheet1')#通过名称获取
table.row_values(i)
table.col_values(i)
nrows = table.nrows
ncols = table.ncols
for i in range(nrows ):
print table.row_values(i)
cell_A1 = table.cell(0,0).value
cell_C4 = table.cell(2,3).value
cell_A1 = table.row(0)[0].value
cell_A2 = table.col(1)[0].value
###
row = 0
col = 0
# 类型 0 empty,1 string, 2 number, 3 date, 4 boolean, 5 error
ctype = 1 value = '单元格的值'
xf = 0 # 扩展的格式化
table.put_cell(row, col, ctype, value, xf)
table.cell(0,0) #单元格的值'
table.cell(0,0).value #单元格的值'
《俄语重音规则》
《俄语词重音基本规律》
http://slovari.yandex.ru/dict/zarva
https://www.cnblogs.com/zle1992/p/6720425.html
随着相乘矩阵的数量(即网络深度)增加,矩阵的乘积变得更加退化(线性相关)。随着网络深度增加,积矩阵的奇异值变得越来越集中,而小部分出现频率很低的奇异值变得任意的大。这种结果不仅仅和线性网络相关。在非线性网络中也会出现类似的现象:随着深度增加,给定层的隐藏单元的维度变得越来越低,即越来越退化。实际上,在有硬饱和边界的非线性网络中(例如 ReLU 网络),随着深度增加,退化过程会变得越来越快。
https://www.w3cschool.cn/tensorflow_python/list/
load要加上encoding='latin1'