卡夫卡

Kafka 是一个分布式消息系统，用于发布和订阅记录流。此演示展示了如何使用 KafkaChatMessageHistory 将聊天消息存储和检索到 Kafka 集群中。

运行 Kafka 集群是运行演示所必需的。您可以按照此说明在本地创建一个 Kafka 集群。

from langchain_community.chat_message_histories import KafkaChatMessageHistory

chat_session_id = "chat-message-history-kafka"
bootstrap_servers = "localhost:64797"  # host:port. `localhost:Plaintext Ports` if setup Kafka cluster locally
history = KafkaChatMessageHistory(
    chat_session_id,
    bootstrap_servers,
)

API 参考：KafkaChatMessageHistory

构造 KafkaChatMessageHistory 的可选参数：

ttl_ms: 聊天消息的生存时间（以毫秒为单位）。
partition: 存储聊天消息的主题分区数量。
replication_factor: 存储聊天消息的主题的复制因子。

KafkaChatMessageHistory 内部使用 Kafka 消费者来读取消息，它具有持久标记已消费位置的能力。它有以下方法来检索聊天消息：

messages: 继续从最后一个聊天消息开始消费。
messages_from_beginning: 将消费者重置到历史记录的开头并消费消息。可选参数：
1. max_message_count: 要读取的最大消息数量。
2. max_time_sec: 读取消息的最大时间（秒）。
messages_from_latest: 将消费者重置到聊天历史记录的末尾并尝试消费消息。可选参数与上述相同。
messages_from_last_consumed: 返回从上次消费的消息继续的消息，类似于 messages，但带有可选参数。

max_message_count 和 max_time_sec 用于避免在检索消息时无限期阻塞。因此，messages 及其他检索消息的方法可能无法返回聊天历史中的所有消息。您需要指定 max_message_count 和 max_time_sec 才能在单次批量操作中检索所有聊天历史。

添加消息并检索。

history.add_user_message("hi!")
history.add_ai_message("whats up?")

history.messages

[HumanMessage(content='hi!'), AIMessage(content='whats up?')]

再次调用 messages 会返回一个空列表，因为消费者已经到达聊天历史的末尾。

history.messages

[]

添加新消息并继续消费。

history.add_user_message("hi again!")
history.add_ai_message("whats up again?")
history.messages

[HumanMessage(content='hi again!'), AIMessage(content='whats up again?')]

重置消费者并从开头读取：

history.messages_from_beginning()

[HumanMessage(content='hi again!'),
 AIMessage(content='whats up again?'),
 HumanMessage(content='hi!'),
 AIMessage(content='whats up?')]

将消费者设置为聊天历史的末尾，添加几条新消息，然后进行消费：

history.messages_from_latest()
history.add_user_message("HI!")
history.add_ai_message("WHATS UP?")
history.messages

[HumanMessage(content='HI!'), AIMessage(content='WHATS UP?')]