去哪儿 IM 分析 - Search

栏目: 数据库 · 发布时间: 5年前

内容简介:昨天「去哪儿」开源了自研的 IM本篇分析的是简单浏览了代码,可以看到 IM Search 是基于 Flask 开发的,而且是单例运行的,带有几个全局变量,甚至还运行在 debug 模式下。没有使用 gunicorn 等 Server。

前言

昨天「去哪儿」开源了自研的 IM Startalk ,作为一个在 IM 领域划水了一段时间的人,也想了解下其他人是如何去考虑 IM 设计,所以就开始了源码阅读之旅。接下来会用几篇文章简单分析一下。

本篇分析的是 Search .

介绍

简单浏览了代码,可以看到 IM Search 是基于 Flask 开发的,而且是单例运行的,带有几个全局变量,甚至还运行在 debug 模式下。没有使用 gunicorn 等 Server。

qtalk_search 提供了搜索用户和搜索群组的功能。

搜索用户

搜索用户是通过一次很 晦涩的 SQL 查询得出的,核心 SQL (原本不带分行的,格式化了一下...):

sql = "select aa.user_id,aa.department,aa.icon,aa.user_name,aa.mood from

  (SELECT a.user_id, a.department, b.url AS icon, a.user_name, b.mood FROM host_users a 
    LEFT JOIN vcard_version b ON a.user_id = b.username 
    WHERE a.hire_flag = 1 
          AND LOWER(a.user_type) != 's' 
          AND (a.user_id ILIKE '%" + username + "%' 
               OR a.user_name ILIKE '%" + username + "%' 
               OR a.pinyin ILIKE '%" + username + "%')) aa 

  left join 
      (select case when m_from = '" + user_id + "' then m_to else m_from end as contact,
              max(create_time) mx 
        from msg_history 
        where m_from = '" + user_id + "' 
              or m_to = '" + user_id + "'
        group by contact) 

      bb on aa.user_id = bb.contact order by bb.mx desc nulls last limit " + str(limit) + " offset " + str(offset) + " ;"

通过字段名猜测能查出:

  1. 用户的 ID
  2. 用户的部门
  3. 用户的头像
  4. 用户名
  5. 用户的心情(或者是签名、状态)?

整个查询会联合 用户表、聊天历史搜索出来和当前用户有聊过天的人。

虽然代码洁癖被多次电疗已经能接受比较奇怪的风格,但是这段 SQL 还是不认直视,大小写不统一、alias 命名随意等问题。 除此之外,用了字符串拼接的方式构造出 SQL 而不是 passing parameters ,也表示存在 SQL 注入的可能。 然而不得不承认这段 SQL 功力强大,估计能写出来的人也不多。

搜索群组

搜索群组的流程和搜索用户的流程大致相同,这里就不累述,只贴一下 SQL

sql = "select a.muc_name, a.domain, b.show_name, b.muc_title, b.muc_pic 
        from user_register_mucs as a 
        left join muc_vcard_info as b 
          on concat(a.muc_name, '@', a.domain) = b.muc_name 
        where a.username = '" + user_id + "' 
          and (b.show_name ilike '%" + groupkey + "%' 
                or b.muc_name like '%" + groupkey + "%')
        limit " + str(limit) + " offset " + str(offset) + ";"

搜索共同群组

sql = "SELECT A.muc_room_name, B.show_name, B.muc_title, B.muc_pic FROM (SELECT muc_room_name, MAX(create_time) as max FROM muc_room_history aa RIGHT JOIN (SELECT muc_name FROM user_register_mucs WHERE username = '" + user_id + "' AND registed_flag != 0 AND muc_name in (SELECT muc_name FROM user_register_mucs WHERE username IN (SELECT user_id FROM host_users WHERE hire_flag = 1 AND (user_id ~ any(array[" + key_str + "]) OR user_name ~ any(array[" + key_str + "]) OR pinyin ~ any(array[" + key_str + "]))) GROUP BY muc_name HAVING COUNT(*) = " + str(
            key_count) + ")) bb ON aa.muc_room_name = bb.muc_name GROUP BY muc_room_name ORDER BY max DESC nulls last LIMIT " + str(
            limit) + " OFFSET " + str(
            offset) + ") A JOIN muc_vcard_info B ON (a.muc_room_name || '@"+conference_str+"') = b.muc_name;"

以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

算法竞赛入门经典

算法竞赛入门经典

刘汝佳、陈锋 / 2012-10 / 52.80元

《算法竞赛入门经典:训练指南》是《算法竞赛入门经典》的重要补充,旨在补充原书中没有涉及或者讲解得不够详细的内容,从而构建一个较完整的知识体系,并且用大量有针对性的题目,让抽象复杂的算法和数学具体化、实用化。《算法竞赛入门经典:训练指南》共6章,分别为算法设计基础、数学基础、实用数据结构、几何问题、图论算法与模型和更多算法专题,全书通过近200道例题深入浅出地介绍了上述领域的各个知识点、经典思维方式......一起来看看 《算法竞赛入门经典》 这本书的介绍吧!

CSS 压缩/解压工具
CSS 压缩/解压工具

在线压缩/解压 CSS 代码

随机密码生成器
随机密码生成器

多种字符组合密码

HEX CMYK 转换工具
HEX CMYK 转换工具

HEX CMYK 互转工具