自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(26)
  • 论坛 (1)
  • 收藏
  • 关注

转载 聚类之DBSCAN学习

DBSCAN的算法步骤http://www.cnblogs.com/chaosimple/archive/2013/07/01/3164775.html1.不用设置k值 (先找到一个点生成一个簇,然后在没有簇的其他点中找到新的点生成新的簇) 2.半径E 3.MinPts——给定点在E邻域内成为核心对象的最小邻域点数...

2017-10-30 21:44:19 205

转载 Java之位运算

位运算简介http://blog.csdn.net/vebasan/article/details/6193916位运算的作用:http://blog.csdn.net/wfzczangpeng/article/details/51819471

2017-10-30 17:14:21 192

转载 数据结构之红黑树

http://www.cnblogs.com/skywang12345/p/3245399.html

2017-10-30 17:11:51 167

转载 数据库索引的数据结构

数据插入数据库就会建立一个索引,以便于查找的时候更加快速。http://www.cnblogs.com/wade-luffy/p/6292784.html

2017-10-30 17:05:26 316

转载 数据结构与算法求前k个最大或者最小值

求最大和最小的前k的值,详细介绍如下:http://www.cnblogs.com/mengdd/archive/2013/03/12/2954914.html

2017-10-30 17:02:33 334

转载 数据结构之堆详细介绍

堆排序在求前k个最大或者最小值的时候有很好的性能,堆学习如下:http://blog.csdn.net/hrn1216/article/details/51465270

2017-10-30 16:59:51 365

转载 Java中二叉树面试题

面试多次问及有关二叉树的题目http://blog.csdn.net/fightforyourdream/article/details/16843303

2017-10-30 16:56:01 453

转载 Python动态爬虫

学习网站http://www.cnblogs.com/pachongshangdexuebi/p/5313381.html模拟浏览器登陆,然后可以模拟点击,模拟滑动,模拟调用js代码。driver.page_source通过上面的方法可以获取网页源代码。

2017-10-30 16:30:03 245

原创 MMseg进行机械分词

MMseg下载地址https://github.com/chenlb/mmseg4j-core在myEclipse下面创建一个Java工程 然后把D:\工作\mmseg4j-core-master\mmseg4j-core-master\src\main\java下面的文件和文件夹拷贝到src下面 然后把lib下面添加junit.jar并且BuildPath 拷入数据D:\工作\mmseg4j

2017-10-26 17:32:30 226

转载 tensorflow中变量的保存和加载

TensorFlow中我们可以保存全部变量也可以保存部分变量 下面是保存全部变量的代码(保存变量的时候要全部初始化)import tensorflow as tf# Create some variables.v1 = tf.Variable('v1', name="v1")v2 = tf.Variable('v2', name="v2")# Add an op to initialize

2017-10-24 13:17:29 1292 1

转载 斯坦福分词有无词库对比

斯坦福分词安装 下载斯坦福分词工具包,下载地址http://nlp.stanford.edu/software/stanford-segmenter-2014-06-16.zip分词使用命令行(注意编码设置成utf8),亲测有效。http://blog.csdn.net/dushenzhi/article/details/8734173Stanford分词使用条件随机场。...

2017-10-24 12:47:23 445

转载 tensorflow中lstm学习

cell的原理,主要讲述lstm中cell里面的三个门,输入门,遗忘门,输出门,详细介绍如下:http://blog.csdn.net/u014595019/article/details/52605693主要讲解lstm输入的数据格式,以及参数。 batch_size定义一次输入的词的个数。 输入的单词都是用id代替,然后需要转化成one_hot向量。 损失函数使用交叉熵,跟cnn类似。

2017-10-23 11:10:05 299

转载 NLTK进行英文分句和分词

中文分句和分词可以使用pyltp。 在使用pyltp进行英文分词和分句的时候会出现错误,这个时候就可以使用NLTK进行英文的分句和分词。http://blog.csdn.net/baidu_27438681/article/details/60468848

2017-10-20 15:40:00 11493

转载 ubuntu安装NLTK并且下载NLTK数据

亲测有效http://liliphd.iteye.com/blog/1514582 d) Download l) List u) Update c) Config h) Help q) Quit---------------------------------------------------------------------------Downloader> dDo

2017-10-20 15:32:23 1958 1

转载 深度学习lstm防止过拟合之dropout

一般我们使用L1和L2进行正则化防止过拟合,在深度学习中我们也可以使用dropout进行正则化。http://www.cnblogs.com/santian/p/5457412.htmldropout是临时删除一部分神经元,梯度下降更新其他神经元的权值。然后下次临时删除其他的神经元同样进行这样的操作,这样就可以防止过拟合。

2017-10-18 15:02:51 14292

原创 Tensorflow官网lstm例子

数据集下载地址:http://www.fit.vutbr.cz/~imikolov/rnnlm/simple-examples.tgz代码下载地址:https://www.tensorflow.org/tutorials/recurrent修改代码设置data_path为数据集下面的data文件夹。

2017-10-18 11:28:25 2441

原创 Python35调用谷歌翻译

import reimport urllibimport urllib.parseimport urllib.requestimport timeurl_google = 'http://translate.google.cn'reg_text = re.compile(r'(?<=TRANSLATED_TEXT=).*?;')user_agent = r'Mozilla/5.0 (W

2017-10-17 17:23:38 732

原创 tensorflow学习fully_connected_feed.py

# Copyright 2015 The TensorFlow Authors. All Rights Reserved.## Licensed under the Apache License, Version 2.0 (the "License");# you may not use this file except in compliance with the License.# Yo

2017-10-17 16:00:43 646

原创 pandas随机选取若干行

在实验交叉验证的时候,可以在pandas中使用sample进行随机选取。import pandas as pddic2 = {'a':[1, 2, 3, 4], 'b':[5, 6, 7, 8],'c':[9, 10, 11, 12], 'd':[13, 14, 15, 16]}df=pd.DataFrame(dic2)print(df)df=df.sample(frac=0.6)prin

2017-10-16 14:38:31 19921 1

转载 python+selenium+PhantomJS抓取ajax动态网页数据

亲测有效http://blog.csdn.net/guoweish/article/details/47339819环境搭建 1.安装Python 2.安装selenium pip install selenium 3.下载PhantomJShttp://download.csdn.net/download/u012024304/9927364打开网页右键点击查看网页源代码和查看有很大区别:h

2017-10-16 12:10:29 1143

原创 CRF++工具遇到的问题

1.训练数据一定要定义成utf-8格式,然后生成的model在测试数据为utf-8的情况下会出现错误。 2.训练数据中不能有空字符,如果有空字符,CRF++的命令行就会出现错误。 3.读写文件的时候一定要定义好是utf-8格式。 4.在命令行显示中文字符的时候,一定要进行chch65001更改编码格式为utf-8。

2017-10-12 11:29:35 1821

原创 MINST数据TensorFlow中CNN测试

import input_datamnist = input_data.read_data_sets('MINST_DATA', one_hot=True)import tensorflow as tfsess = tf.InteractiveSession()x = tf.placeholder("float", shape=[None, 784])y_ = tf.placeholder

2017-10-10 21:47:55 497

转载 ubuntu安装CRF++

http://blog.csdn.net/zhongkeli/article/details/12677665亲测有效。

2017-10-10 21:46:10 242

原创 MINST数据softmax进行数字识别

1.首先安装TensorFlow最好Python在3.5以上。 2.下载intput_data.py进行下载minst数据和使用数据。 3.修改intput_data.py中的错误。return numpy.frombuffer(bytestream.read(4), dtype=dt)修改为下面return numpy.frombuffer(bytestream.read(4), dtyp

2017-10-10 20:20:06 602

原创 ubuntu环境下python3.5安装pyltp

安装完成pip之后,可以使用pip安装pyltpsudo pip3 install pyltp命令报错error: Setup script exited with error: command 'x86_64-linux-gnu-gcc' failed with exit status 1在stackoverflow中可以查到解决方法:https://stackoverflow.com/quest

2017-10-09 14:04:39 2454

转载 VM安装ubuntu出错二进制与此平台上的长模式不兼容

设置电脑支持CPU虚拟化,亲测有效http://jingyan.baidu.com/article/636f38bb4f40f9d6b84610f7.html

2017-10-09 11:32:55 1041

空空如也

勿在浮沙筑高台LS的留言板

发表于 2020-01-02 最后回复 2020-01-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除