文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

python搜索模块的查询方法

2023-06-14 22:50

关注

小编给大家分享一下python搜索模块的查询方法,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!

python的数据类型有哪些?

python的数据类型:1. 数字类型,包括int(整型)、long(长整型)和float(浮点型)。2.字符串,分别是str类型和unicode类型。3.布尔型,Python布尔类型也是用于逻辑运算,有两个值:True(真)和False(假)。4.列表,列表是Python中使用最频繁的数据类型,集合中可以放任何数据类型。5. 元组,元组用”()”标识,内部元素用逗号隔开。6. 字典,字典是一种键值对的集合。7. 集合,集合是一个无序的、不重复的数据组合。

1、说明

获取原始数据并构建倒排索引后,可根据用户输入查找相关内容。

先对用户的输入进行分词。

然后根据倒排索引获取与每个单词相关的文章。

最后,计算每个单词和相关文章之间的分数。分数越高,相关性越大。

2、实例

def search(self, query):    BM25_scores = {}     # 对用户输入分词    # 并将其变成 {word: frequency, ...} 的形式    query = jieba.lcut_for_search(query)    word2freq = self.format(query)     # 遍历每个词    # 计算每个词与相关文章之间的得分(计算公式参考 BM25 算法)    for word in word2freq:        data = self.iindex.get(word)        if not data:            continue        BM25_score = 0        qf = word2freq[word]        df = data['df']        ds = data['ds']        W = math.log((self.N - df + 0.5) / (df + 0.5))        for doc in ds:            doc_id = doc['id']            tf = doc['tf']            dl = doc['dl']            K = self.k1 * (1 - self.b + self.b * (dl / self.AVGDL))            R = (tf * (self.k1 + 1) / (tf + K)) * (qf * (self.k2 + 1) / (qf + self.k2))            BM25_score = W * R            BM25_scores[doc_id] = BM25_scores[doc_id] + BM25_score if doc_id in BM25_scores else BM25_score     # 对所有得分按从大到小的顺序排列,返回结果    BM25_scores = sorted(BM25_scores.items(), key = lambda item: item[1])    BM25_scores.reverse()    return BM25_scores

看完了这篇文章,相信你对“python搜索模块的查询方法”有了一定的了解,如果想了解更多相关知识,欢迎关注编程网行业资讯频道,感谢各位的阅读!

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯