Hi,

I'm Sheldon Liu

👋

AI product manager, AI enthusiast.

I’m Sheldon, a AI product manager based in Shanghai. Welcome to make friends,Wechat:FindJay0412

github-contribution

What I've done and what I'm doing.

I've worked on a variety of projects, from websites to AI applications. And some of them are open-source. Here are a few of my projects.

  • Truth AI favicon

    Truth AI

    AI-powered party game for truth or dare. Helps users generate truth or dare questions based on the user's current situation.

    IOS App
    AI Generation
    AI Party game
    Truth or Dare
  • Texpap favicon

    Texpap

    AI-powered academic assistant for paper reading and presentation generation. Helps researchers understand papers and create professional academic slides.

    Academic Assistant
    AI Paper Reading
    Presentation Generator
  • Jikejiema favicon

    Jikejiema

    Personal analytics tool for Jike social media, providing insights and analysis of user activities and engagement patterns.

    Social Media Analytics
    Personal Insights
    Data Analysis
  • LLM.Snailsshell favicon

    LLM.Snailsshell

    A unified LLM API platform built on OneAPI, providing seamless integration of multiple language models and API management capabilities.

    LLM Integration
    API Management
    AI Platform
  • zhufu.me favicon

    zhufu.me

    AI-powered social content generator specializing in creating personalized greetings and wishes for various occasions.

    AI Writing
    Social Content
    Greeting Generator

Open Source

  • Texpap

    AI-powered academic assistant for paper reading and presentation generation

    11
  • IOS-Test

    A self-hosted platform for distributing iOS apps to internal testers and users. Built with Next.js.

    11
  • Image_stitching

    A Python script tool for automatic photo stitching, supporting various stitching modes and image formats

    11
  • ChatAI_Hub

    A browser extension aggregating multiple Chinese LLM platforms, featuring integrated tools like screenshot capture, prompt management, and browsing time statistics

    11
  • Whisper-Input

    A local script for inputting text using voice, supporting multiple languages and voice assistants

    11

What I've been thinking about.

Thoughts on AI, product, and programming.

Work

  1. Company
    Looking for opportunities
    Title
    AI Product Manager Intern
    Date
    2024 - Present

Education

  1. Company
    Currently a graduate student
    Title
    Statistics
    Date
    2023 - 2026

Subscribe my blogs

Welcome to Subscribe my blogs

https://snailsshell.com/feed

My Activity

My Recent Posts on Jike

试着build一个航班值机选座助手,觉得这玩意儿要比想象麻烦,也和大家分享下个人记录。首先想说,技术本身并不是最大障碍。座位信息的严格管控,就意味着无法通过API或公开渠道直接查询,只能手动上传选座页面的截图。然而这些截图往往信息不全,比如缺少座位字母标识,需要根据机型信息匹配知识库,让模型自行判断座位号。其次,实验了目前T0的一批多模态LLM,效果都一言难尽,完全是不可用的状态。解决“看不到”的问题,就试着用cv做算法识别,这个办法的确可以,但需要功夫设计。不同预订渠道对座位状态的显示方式各异,比如会使用不用颜色表示已选/可选,这都是要考虑的问题,再复杂,就需要一定的算法优化或者小模型训练(感觉这种简单任务用不着)。图里分享的是我通过vibe coding优化下来的一套识别方案,一秒输出,还是非常准确的。关于知识库来源,我爬取了🍠上的选座指南和用户经验,算不上系统全面,但好在大多都能找到。本来考虑了引入联网搜索,但查下来发现航班选座这一块并没有特别权威和集中的信息源,不太有必要引入。总地来说,是一个不太满意的Demo,整个流程的自动化程度较低,需要手动上传航班信息和截图,值机操作也要自己完成,如果再谈依靠端侧模型操作手机,当然可以完成,显然又小题大做。

试着build一个航班值机选座助手,觉得这玩意儿要比想象麻烦,也和大家分享下个人记录。首先想说,技术本身并不是最大障碍。座位信息的严格管控,就意味着无法通过API或公开渠道直接查询,只能手动上传选座页面的截图。然而这些截图往往信息不全,比如缺少座位字母标识,需要根据机型信息匹配知识库,让模型自行判断座位号。其次,实验了目前T0的一批多模态LLM,效果都一言难尽,完全是不可用的状态。解决“看不到”的问题,就试着用cv做算法识别,这个办法的确可以,但需要功夫设计。不同预订渠道对座位状态的显示方式各异,比如会使用不用颜色表示已选/可选,这都是要考虑的问题,再复杂,就需要一定的算法优化或者小模型训练(感觉这种简单任务用不着)。图里分享的是我通过vibe coding优化下来的一套识别方案,一秒输出,还是非常准确的。关于知识库来源,我爬取了🍠上的选座指南和用户经验,算不上系统全面,但好在大多都能找到。本来考虑了引入联网搜索,但查下来发现航班选座这一块并没有特别权威和集中的信息源,不太有必要引入。总地来说,是一个不太满意的Demo,整个流程的自动化程度较低,需要手动上传航班信息和截图,值机操作也要自己完成,如果再谈依靠端侧模型操作手机,当然可以完成,显然又小题大做。

试着build一个航班值机选座助手,觉得这玩意儿要比想象麻烦,也和大家分享下个人记录。首先想说,技术本身并不是最大障碍。座位信息的严格管控,就意味着无法通过API或公开渠道直接查询,只能手动上传选座页面的截图。然而这些截图往往信息不全,比如缺少座位字母标识,需要根据机型信息匹配知识库,让模型自行判断座位号。其次,实验了目前T0的一批多模态LLM,效果都一言难尽,完全是不可用的状态。解决“看不到”的问题,就试着用cv做算法识别,这个办法的确可以,但需要功夫设计。不同预订渠道对座位状态的显示方式各异,比如会使用不用颜色表示已选/可选,这都是要考虑的问题,再复杂,就需要一定的算法优化或者小模型训练(感觉这种简单任务用不着)。图里分享的是我通过vibe coding优化下来的一套识别方案,一秒输出,还是非常准确的。关于知识库来源,我爬取了🍠上的选座指南和用户经验,算不上系统全面,但好在大多都能找到。本来考虑了引入联网搜索,但查下来发现航班选座这一块并没有特别权威和集中的信息源,不太有必要引入。总地来说,是一个不太满意的Demo,整个流程的自动化程度较低,需要手动上传航班信息和截图,值机操作也要自己完成,如果再谈依靠端侧模型操作手机,当然可以完成,显然又小题大做。

试着build一个航班值机选座助手,觉得这玩意儿要比想象麻烦,也和大家分享下个人记录。首先想说,技术本身并不是最大障碍。座位信息的严格管控,就意味着无法通过API或公开渠道直接查询,只能手动上传选座页面的截图。然而这些截图往往信息不全,比如缺少座位字母标识,需要根据机型信息匹配知识库,让模型自行判断座位号。其次,实验了目前T0的一批多模态LLM,效果都一言难尽,完全是不可用的状态。解决“看不到”的问题,就试着用cv做算法识别,这个办法的确可以,但需要功夫设计。不同预订渠道对座位状态的显示方式各异,比如会使用不用颜色表示已选/可选,这都是要考虑的问题,再复杂,就需要一定的算法优化或者小模型训练(感觉这种简单任务用不着)。图里分享的是我通过vibe coding优化下来的一套识别方案,一秒输出,还是非常准确的。关于知识库来源,我爬取了🍠上的选座指南和用户经验,算不上系统全面,但好在大多都能找到。本来考虑了引入联网搜索,但查下来发现航班选座这一块并没有特别权威和集中的信息源,不太有必要引入。总地来说,是一个不太满意的Demo,整个流程的自动化程度较低,需要手动上传航班信息和截图,值机操作也要自己完成,如果再谈依靠端侧模型操作手机,当然可以完成,显然又小题大做。

试着build一个航班值机选座助手,觉得这玩意儿要比想象麻烦,也和大家分享下个人记录。首先想说,技术本身并不是最大障碍。座位信息的严格管控,就意味着无法通过API或公开渠道直接查询,只能手动上传选座页面的截图。然而这些截图往往信息不全,比如缺少座位字母标识,需要根据机型信息匹配知识库,让模型自行判断座位号。其次,实验了目前T0的一批多模态LLM,效果都一言难尽,完全是不可用的状态。解决“看不到”的问题,就试着用cv做算法识别,这个办法的确可以,但需要功夫设计。不同预订渠道对座位状态的显示方式各异,比如会使用不用颜色表示已选/可选,这都是要考虑的问题,再复杂,就需要一定的算法优化或者小模型训练(感觉这种简单任务用不着)。图里分享的是我通过vibe coding优化下来的一套识别方案,一秒输出,还是非常准确的。关于知识库来源,我爬取了🍠上的选座指南和用户经验,算不上系统全面,但好在大多都能找到。本来考虑了引入联网搜索,但查下来发现航班选座这一块并没有特别权威和集中的信息源,不太有必要引入。总地来说,是一个不太满意的Demo,整个流程的自动化程度较低,需要手动上传航班信息和截图,值机操作也要自己完成,如果再谈依靠端侧模型操作手机,当然可以完成,显然又小题大做。

试着build一个航班值机选座助手,觉得这玩意儿要比想象麻烦,也和大家分享下个人记录。首先想说,技术本身并不是最大障碍。座位信息的严格管控,就意味着无法通过API或公开渠道直接查询,只能手动上传选座页面的截图。然而这些截图往往信息不全,比如缺少座位字母标识,需要根据机型信息匹配知识库,让模型自行判断座位号。其次,实验了目前T0的一批多模态LLM,效果都一言难尽,完全是不可用的状态。解决“看不到”的问题,就试着用cv做算法识别,这个办法的确可以,但需要功夫设计。不同预订渠道对座位状态的显示方式各异,比如会使用不用颜色表示已选/可选,这都是要考虑的问题,再复杂,就需要一定的算法优化或者小模型训练(感觉这种简单任务用不着)。图里分享的是我通过vibe coding优化下来的一套识别方案,一秒输出,还是非常准确的。关于知识库来源,我爬取了🍠上的选座指南和用户经验,算不上系统全面,但好在大多都能找到。本来考虑了引入联网搜索,但查下来发现航班选座这一块并没有特别权威和集中的信息源,不太有必要引入。总地来说,是一个不太满意的Demo,整个流程的自动化程度较低,需要手动上传航班信息和截图,值机操作也要自己完成,如果再谈依靠端侧模型操作手机,当然可以完成,显然又小题大做。