wzhiju

浏览: 139049 次
性别:
来自: 北京

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

在这篇文章中，着重介绍了利用三叉树的结构特点来进行分词词典的组织。三叉树，顾名思义，具有三个分支lower，higher，equal。首先为每一个结点设置“转向词”，也即用来进行比较和搜索的一个字。比如有三个词语，“我们”，“中国”，“人们”；在构造词典时，首先创建树根，root ；root 的“转向词”设置为“我”，root的equal分支为“们”；然后，由于 "中国".charAt(0) - root.splitchar >0；所有将“中”其放置在root的higher节点位置，“国”放置在“中”的equal结点位置；同理进行词“人们”的构造。 ...

2010-11-09 15:54
浏览 1008
评论(0)
分类:互联网

java读取文件乱码的问题的解决方法

博客分类：

Java 编程

Java XML 编程

我们在涉及到读取文本文件时，常常会由于格式的设置原因出现乱码问题，有些人经常通过设置整个项目的编码格式来解决，殊不知通过此方法常常会使java文件中的汉字转化为乱码，仍然不可取。最好的途径是在读取文件时，就设置好格式。例子程序如下： try { BufferedReader reader = new BufferedReader(new InputStreamReader(new FileInputStream(fileChooser.getSelectedFile()),"gb2312")); ...

2010-10-10 20:40
浏览 1266
评论(3)
论坛回复 / 浏览 (3 / 2956)
分类:编程语言

JTextArea append() 方法的每次循环不能正常显示的问题

博客分类：

Java 编程

多线程

最近在写一个桌面程序时，涉及到要向JTextArea 中每次循环写入数据，开始程序如下： for (int k = 0; k < hrefs.size() && k < 50; k++) { ...... ...... jTextArea1.append(hrefs.get(k).getUrl() + " Analysis Completed...\n"); } 其中jTextArea1为一个文本区域，hrefs 为一个链表LinkedList<Href>,(Href 为自己定义的一个类)，但是当运行 ...

2010-10-09 21:44
浏览 2773
评论(2)
论坛回复 / 浏览 (2 / 3239)
分类:编程语言

自己DIY一个简单的邮箱登陆页面

Yahoo 浏览器 XHTML HTML

最近经常登陆邮箱，虽然浏览器能够记住登陆的用户名和密码，但是每次还要手动打开浏览器，感觉有些许麻烦，所以写了一个自动登录到我的yahoo邮箱的一个简单页面，在这里和大家一同分享一下。以yahoo邮箱为例： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.or ...

2010-10-04 15:32
浏览 1769
评论(0)
论坛回复 / 浏览 (0 / 2290)
分类:互联网

利用htmlCleaner 来做网页分析

博客分类：

Java 编程

HTML 网页分析算法

最近在一个项目用到了从网页中提取正文信息，基于这个模块有很多专家学者讨论了各种各样的算法和网页提取工具。但有些算法，比如配置摸版和基于视觉的分析、块分析方法，有些复杂麻烦，有些针对性太强，况且网页类型� ...

2010-10-04 15:17
浏览 1825
评论(0)
论坛回复 / 浏览 (0 / 4858)
分类:互联网

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

分词词典的构造机制（二）

java读取文件乱码的问题的解决方法

JTextArea append() 方法的每次循环不能正常显示的问题

自己DIY一个简单的邮箱登陆页面

利用htmlCleaner 来做网页分析

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

分词词典的构造机制（二）

java读取文件乱码的问题的解决方法

JTextArea append() 方法的每次循环不能正常显示的问题

自己DIY一个简单的邮箱登陆页面

利用htmlCleaner 来做网页分析

最近访客更多访客>>