`
leiwuluan
  • 浏览: 694544 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类

Lucene Field 分析笔记

 
阅读更多

      Field 类也许是在文档索引期限间最重要的类了:该类在事实上控制着被索的域值。当创建好一个域时,你可以指定多个域外选项来控制Lucene在将文档添加进索引后针对该域的行为。

 

 

AbstractField
--->Field
--->FieldForMerge
--->LazyField
--->NumericField

 从源代码中,可以看出Field 构造函数如下

org.apache.lucene.document.Field
Field(String, boolean, String, Store, Index, TermVector)
Field(String, byte[])
Field(String, byte[], int, int)
Field(String, byte[], int, int, Store)
Field(String, byte[], Store)
Field(String, Reader)
Field(String, Reader, TermVector)
Field(String, String, Store, Index)
Field(String, String, Store, Index, TermVector)
Field(String, TokenStream)
Field(String, TokenStream, TermVector) 

 三个内部类Field.Index,Field.Store,Field.termVector

org.apache.lucene.document.Field.Index
public static final Index NO;不建立索引 
public static final Index ANALYZED;分词,建索引
public static final Index ANALYZED_NO_NORMS;分词,建索引(但是Field的值不像通常那样被保存,而是只取一个byte,这样节约存储 空间)
public static final Index NOT_ANALYZED;不分词,建索引
public static final Index NOT_ANALYZED_NO_NORMS;不分词,建索引(但是Field的值不像通常那样被保存,而是只取一个byte,这样节约存储 空间)

org.apache.lucene.document.Field.Store
public static final Store YES;保存
public static final Store NO;不保存

org.apache.lucene.document.Field.TermVector这个参数也不常用,它有五个选项。
Field.TermVector.NO表示不索引Token的位置属性;
Field.TermVector.YES则表示存储向量。
Field.TermVector.WITH_OFFSETS表示额外索引Token的结束点;
Field.TermVector.WITH_POSITIONS表示额外索引Token的当前位置;
Field.TermVector.WITH_POSITIONS_OFFSETS表示额外索引Token的当前和结束位置;

 源码实例:

Field name=new Field("name","Leiwuluan",Store.YES,Index.NOT_ANALYZED);
Field name=new Field("age","23",Store.YES,Index.NOT_ANALYZED);

 

1
0
分享到:
评论

相关推荐

    lucene使用总结笔记

    lucene使用总结笔记lucene使用总结笔记lucene使用总结笔记lucene使用总结笔记lucene使用总结笔记

    本人的Lucene2.9学习笔记

    本人的Lucene2.9学习笔记 本人的Lucene2.9学习笔记 本人的Lucene2.9学习笔记 本人的Lucene2.9学习笔记本人的Lucene2.9学习笔记本人的Lucene2.9学习笔记 本人的Lucene2.9学习笔记

    传智播客Lucene课程课堂笔记

    传智播客Lucene课程课堂笔记

    lucene3源码分析

    lucene3源码分析

    Lucene 3.6 学习笔记

    (1) 分析需求,创建接口 49 (2) 创建过滤器,继承Filter 50 (3) 实现接口,效果演示 52 第六章 LUCENE扩展 54 6.1 Luke 54 (1) 启动Luke 54 (2) 索引概述页面 55 (3) 查看索引信息 56 (4) 查询索引信息 57 6.2 Tika ...

    lucene基础学习笔记&源码

    lucene基础学习笔记&源码

    Lucene 课堂笔记

    传智播客lucene课堂笔记,和大家分享下,就是上课的时候记的

    Lucene数据搜索笔记

    Lucene是apache软件基金会 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,但它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎...

    lucene3.5学习笔记

    介绍lucene3.5的相关技术,包括基本用法、分析器、索引建立与查询,扩展的高亮、分页、以及solr3.5的相关用法

    Lucene部分笔记

    一些Lucene类的常用方法,初学者可以看一下,来自《开发自己的搜索引擎》一书。

    lucene笔记.pdf

    lucene笔记

    LUCENE分析介绍功能

    文本分析的高级算法 有详细论文介绍LUCENE分析介绍功能

    lucene原理分析pdf

    Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎...

    Lucene 原理与代码分析完整版

    lucene原理分析完整版,中文Lucene 原理与代码分析完整版

    lucene笔记

    4、 Field域(重点) 5、 索引维护 a) 添加索引 b) 删除索引 c) 修改索引 6、 搜索(重点) a) 通过Query子类创建查询对象 b) 通过QueryParser创建查询对象 7、 相关度排序 8、 中文分词器(重点)

    lucene课程笔记

    关于lucene开发的工作笔记,详细的介绍了lucene的索引在创建过程中应该主意的一些事项和要求

    lucene 3.5学习笔记

    NULL 博文链接:https://lpf.iteye.com/blog/1440160

    lucene3.0学习笔记(三)与paoding整合

    NULL 博文链接:https://langxiashahai.iteye.com/blog/703285

Global site tag (gtag.js) - Google Analytics