Skip to main content
Open In ColabOpen on GitHub

卡夫卡

Kafka 是一个分布式消息系统,用于发布和订阅记录流。 此演示展示了如何使用 KafkaChatMessageHistory 将聊天消息存储和检索到 Kafka 集群中。

运行 Kafka 集群是运行演示所必需的。您可以按照此 说明 在本地创建一个 Kafka 集群。

from langchain_community.chat_message_histories import KafkaChatMessageHistory

chat_session_id = "chat-message-history-kafka"
bootstrap_servers = "localhost:64797" # host:port. `localhost:Plaintext Ports` if setup Kafka cluster locally
history = KafkaChatMessageHistory(
chat_session_id,
bootstrap_servers,
)

构造 KafkaChatMessageHistory 的可选参数:

  • ttl_ms: 聊天消息的生存时间(以毫秒为单位)。
  • partition: 存储聊天消息的主题分区数量。
  • replication_factor: 存储聊天消息的主题的复制因子。

KafkaChatMessageHistory 内部使用 Kafka 消费者来读取消息,它具有持久标记已消费位置的能力。它有以下方法来检索聊天消息:

  • messages: 继续从最后一个聊天消息开始消费。
  • messages_from_beginning: 将消费者重置到历史记录的开头并消费消息。可选参数:
    1. max_message_count: 要读取的最大消息数量。
    2. max_time_sec: 读取消息的最大时间(秒)。
  • messages_from_latest: 将消费者重置到聊天历史记录的末尾并尝试消费消息。可选参数与上述相同。
  • messages_from_last_consumed: 返回从上次消费的消息继续的消息,类似于 messages,但带有可选参数。

max_message_countmax_time_sec 用于避免在检索消息时无限期阻塞。 因此,messages 及其他检索消息的方法可能无法返回聊天历史中的所有消息。您需要指定 max_message_countmax_time_sec 才能在单次批量操作中检索所有聊天历史。

添加消息并检索。

history.add_user_message("hi!")
history.add_ai_message("whats up?")

history.messages
[HumanMessage(content='hi!'), AIMessage(content='whats up?')]

再次调用 messages 会返回一个空列表,因为消费者已经到达聊天历史的末尾。

history.messages
[]

添加新消息并继续消费。

history.add_user_message("hi again!")
history.add_ai_message("whats up again?")
history.messages
[HumanMessage(content='hi again!'), AIMessage(content='whats up again?')]

重置消费者并从开头读取:

history.messages_from_beginning()
[HumanMessage(content='hi again!'),
AIMessage(content='whats up again?'),
HumanMessage(content='hi!'),
AIMessage(content='whats up?')]

将消费者设置为聊天历史的末尾,添加几条新消息,然后进行消费:

history.messages_from_latest()
history.add_user_message("HI!")
history.add_ai_message("WHATS UP?")
history.messages
[HumanMessage(content='HI!'), AIMessage(content='WHATS UP?')]