自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(30)
  • 论坛 (1)
  • 收藏
  • 关注

转载 MEMM,HMM,CRF三者之间的关系

隐马尔可夫模型(Hidden Markov Model,HMM),最大熵马尔可夫模型(Maximum Entropy Markov Model,MEMM)以及条件随机场(Conditional Random Field,CRF)是序列标注中最常用也是最基本的三个模型。HMM首先出现,MEMM其次,CRF最后。三个算法主要思想如下:HMM模型是对转移概率和表现概率直接建模,统计共现概率。 MEMM模

2017-05-31 17:49:54 1144

转载 HMM和维比特算法学习

HMM算法学习http://blog.csdn.net/yywan1314520/article/details/50454063

2017-05-31 17:01:19 585

转载 最小二乘与梯度下降法

最小二乘法介绍如下:http://www.cnblogs.com/softlin/p/5965939.html梯度下降法介绍(吴恩达的课程上面对梯度下降法的讲解)http://www.cnblogs.com/softlin/p/5965939.html两者对比的介绍:http://www.cnblogs.com/zhizhan/p/4639670.html

2017-05-31 09:33:03 338

原创 Java数据预处理

这里介绍oracle数据库中BLOB类型字段内容读取为ZIP格式文件,并且进行解压缩和对解压后文件进行处理,代码如下:package readele;import java.io.BufferedInputStream;import java.io.BufferedOutputStream;import java.io.BufferedReader;import java.io.Buffere

2017-05-25 09:21:28 3353

转载 sklearn分类算法测试以及自动化调参

测试数据为鸢尾花数据0 5.1 3.5 1.4 0.20 4.9 3.0 1.4 0.20 4.7 3.2 1.3 0.20 4.6 3.1 1.5 0.20 5.0 3.6 1.4 0.20 5.4 3.9 1.7 0.40 4.6 3.4 1.4 0.30 5.0 3.4 1.5 0.20 4.4 2.9 1.4 0.20 4.9 3.1 1.5 0.10 5.4 3.7 1

2017-05-24 09:48:09 8430 2

转载 pandas.read_csv参数整理

读取CSV(逗号分割)文件到DataFrame 也支持文件的部分导入和选择迭代 更多帮助参见:http://pandas.pydata.org/pandas-docs/stable/io.html 参数: filepath_or_buffer : str,pathlib。str, pathlib.Path, py._path.local.LocalPath or any object wit

2017-05-24 09:41:20 466

转载 sklearn分类算法汇总

import osimport numpy as npimport pandas as pdfrom sklearn import datasetsfrom sklearn import preprocessingfrom sklearn import neighborsfrom sklearn.discriminant_analysis import LinearDiscriminan

2017-05-23 17:04:31 1193

转载 python pandas IO tools 之read_csv文件读写参数详解

python pandas IO tools 之csv文件读写英文原文:pandas IO tools读取csv文件:pd.read_csv(),写入csv文件:pd.to_csv() pandas还可以读取一下文件: read_csv, read_excel, read_hdf, read_sql, read_json, read_msgpack (experiment

2017-05-23 16:33:45 413

翻译 sklearn中数据预处理(preprocessing)

Standardization即标准化,尽量将数据转化为均值为零,方差为一的数据,形如标准正态分布(高斯分布)。实际中我们会忽略数据的分布情况,仅仅是通过改变均值来集中数据,然后将非连续特征除以他们的标准差。sklearn中 scale函数提供了简单快速的singlearray-like数据集操作。一、标准化,均值去除和按方差比例缩放(Standardization, or mean removal

2017-05-23 16:18:01 358

原创 sklearn之训练数据和测试数据随机选取

我们在分类的时候需要把数据分成两部分,一部分是训练数据一部分是测试数据。sklearn可以随机的按照设置的比例选取训练数据和测试数据并且样本和标签是对应的分组。 实验代码如下:#!/usr/bin/env python# -*- coding: utf-8 -*-"""功能:数据集按比例切分为训练集和测试集时间:2017年3月11日 12:48:57"""from sklearn.cros

2017-05-23 16:05:33 5388

原创 sklearn之svm学习

1.获取分类数据,分类数据中iris中文指鸢尾植物,这里存储了其萼片和花瓣的长宽,一共4个属性,鸢尾植物又分三类。与之相对,iris里有两个属性iris.data,iris.target,data里是一个矩阵,每一列代表了萼片或花瓣的长宽,一共4列,每一列代表某个被测量的鸢尾植物,一共采样了150条记录from sklearn import datasetsdef getData_1():

2017-05-23 14:44:03 453

原创 kettle学习之csv-oracle

1.建立csv输入,可以在列分隔符里面设置分隔符格式。 2.建立表输出,在目标表中选择输入表。 3.连接输入与输出。 4.建立字段映射,勾选指定数据库字段,点击数据库字段并且点击输入字段映射。 5.字段映射。 6.映射完之后点击运行。

2017-05-22 18:11:16 1077

原创 kettle学习之oracle-csv

1.创建表输入。 2.新建数据库连接。 上述步骤详见本人kettle新建数据库连接博客。 3.写输入数据的sql,sql填写位置见下图。 sql内容select 编码,名称 from nyns.收费项目类别4.创建csv输出,文件路径填写在文件名称中。 5.按住shift键,在输入和输出之间添加箭头。 6.点击运行。 结果如下:名称;编码挂号;1西成药;5中成药;6中

2017-05-22 17:31:23 648

原创 kettle新建数据库连接

1.先新建转化。 2.新建一个输入->表输入 3.创建一个表输入 、 4.点击上面的新建创建一个数据库连接。

2017-05-22 17:18:30 2388 1

原创 kettle安装

1.kettle是一个免安装版软件,在网上下载pdi-ce-7.0.0.0-25并且进行解压就可以安装。 2.因为kettle是用Java语言开发的ETL工具,所以在使用kettle的时候必须安装JDK并且配置环境变量,怎么配置环境变量就不在这里赘述。 3.配置kettle的环境变量。【开始】->【计算机】->【属性】->【高级系统属性】->【高级】->【环境变量】->【新建】,创建用户变量。变

2017-05-22 16:39:57 1579

转载 JAVA对数据进行压缩和解压

程序实现了ZIP压缩。共分为2部分 : 压缩(compression)与解压(decompression)大致功能包括用了多态,递归等Java核心技术,可以对单个文件和任意级联文件夹进行压缩和解压。 需在代码中自定义源输入路径和目标输出路径。 package com.han; import java.io.*; import java.util.zip.*; /** * 程序实现了ZIP

2017-05-22 11:15:32 920

原创 NLP计算词相关关系之word2vec

import gensiminp='D:\python_noweightpathway\TIA\TIAxmmc.txt'outp1 = 'D:\python_noweightpathway\TIA\model'outp2 = 'D:\python_noweightpathway\TIA\vector'sentences=[]#读取数据生成sentencesfile=open(u'D:...

2017-05-17 10:07:34 735

转载 NLP计算文档相似度之LSH

#coding:utf-8# 使用lsh来处理 前缀树 from sklearn.feature_extraction.text import TfidfVectorizer import jieba.posseg as psegfrom sklearn.neighbors import LSHForestimport osdef a_sub_b(a,b): ret = []

2017-05-17 10:03:23 1334

转载 NLP计算文档相似度之TF-IDF

#!/usr/bin/python # -*- coding: utf-8 -*-import numpyimport osfrom sklearn import feature_extractionfrom sklearn.feature_extraction.text import TfidfTransformerfrom sklearn.feature_extraction.t...

2017-05-17 10:01:18 1547

原创 NLP计算文档相似度之doc2vec

import gensimoutp1 = 'D:\python_noweightpathway\TIA\docmodel'file = open(u'D:\python_noweightpathway\TIA\TIAxmmc.txt', encoding='utf-8')# fileghdjid = open(u'D:\python_noweightpathway\TIA\TIA.txt'

2017-05-17 09:59:45 3503

转载 python中的多线程学习

#! /usr/bin/env pythonimport osimport timeimport threading# 进程函数def printthread(n): print (n,"-->进程创建") for a in range(4): print (a) time.sleep(1) print (n,"-->进程结束")

2017-05-15 14:19:26 258

转载 一张图说明softmax layer是什么

深度学习交流群 623099442

2017-05-13 14:32:07 464

转载 Huffman树与Huffman编码

转载请注明出处:http://blog.csdn.net/ns_code/article/details/19174553Huffman Tree简介 赫夫曼树(Huffman Tree),又称最优二叉树,是一类带权路径长度最短的树。假设有n个权值{w1,w2,…,wn},如果构造一棵有n个叶子节点的二叉树,而这n个叶子节点的权值是{w1,w2,…,wn},则所构造出的带权路径长度最小的二

2017-05-10 18:15:38 285

转载 激活函数之tanh

1.tanh函数的公式 tanhx = (e^(x)-e^(-x)) /(e^x+e^(-x)) 2.tanh函数的图形

2017-05-10 17:21:42 4519

转载 深度学习之激活函数

sigmoid激活函数sigmoid将一个实数输入映射到[0,1]范围内,如下图(左)所示。使用sigmoid作为激活函数存在以下几个问题:梯度饱和。当函数激活值接近于0或者1时,函数的梯度接近于0。在反向传播计算梯度过程中:δ(l)=(W(l))Tδ(l+1)∗f′(z(L)),每层残差接近于0,计算出的梯度也不可避免地接近于0。这样在参数微调过程中,会引起参数弥散问题,传到前几层的...

2017-05-10 17:19:00 325

翻译 sklearn中KMeans学习

参数: n_clusters (聚类个数): int类型 可选参数 默认值:8 聚类的个数也是聚类中心的个数 max_iter(最大迭代次数): ...

2017-05-08 16:08:20 409

转载 ubuntu下安装python3.4

亲测有效: http://www.cnblogs.com/gzp2015/p/4617268.html 在make和make install 前面添加sudo

2017-05-06 18:05:14 1168

转载 ubuntu下安装eclipse

亲测有效: http://www.cnblogs.com/jxldjsn/p/5682390.html

2017-05-06 17:09:30 365

转载 解决Linux系统输入登陆密码正确,但闪回登陆界面,无法登录的问题

亲测下面的连接有效: https://jingyan.baidu.com/article/08b6a591b16dbf14a80922e4.html

2017-05-06 17:01:09 11236

原创 Oracle中Blob读取

package readele;import java.io.BufferedReader;import java.io.BufferedWriter;import java.io.DataOutputStream;import java.io.File;import java.io.FileNotFoundException;import java.io.FileOutputStream

2017-05-03 18:48:18 1396

空空如也

勿在浮沙筑高台LS的留言板

发表于 2020-01-02 最后回复 2020-01-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除