情感分析在客户反馈中的应用实践

February 18, 2019 · 9 min read

郭流芳

资深算法工程师

"客户的声音是产品改进的指南针。但当声音太多时，我们需要一个情感分析的罗盘来指引方向。" —— 2018年初，在广联达分析海量用户反馈时的感悟

背景：从“听到”到“听懂”

在广联达，我们每年都会收到数以万计的用户反馈，这些反馈来自论坛、工单、客服聊天记录等多种渠道。每一条反馈都是宝贵的财富，但如何从这片数据的海洋中快速、准确地提炼出有效信息，识别出用户的真实情绪和核心诉求，是一个巨大的挑战。

问题识别：哪些功能是用户抱怨最多的？
风险预警：哪些用户有流失风险？
机会发现：哪些建议蕴含着下一个明星功能？

情感分析（Sentiment Analysis），或称意见挖掘（Opinion Mining），正是解决这一问题的关键技术。它旨在自动识别和提取文本中的主观信息，判断其情感倾向（正面、负面、中性）。

这篇博客将带你走过从传统方法到深度学习的情感分析实践之旅。

1. 传统方法：情感词典

最直观的方法是基于情感词典。我们预先定义好一个包含正面词（如“好用”、“喜欢”、“赞”）和负面词（如“垃圾”、“难用”、“卡顿”）的词库，然后统计文本中各类词语出现的次数来判断情感。

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import jieba
from collections import Counter

# 设置中文字体
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

class DictionaryBasedSentiment:
    """基于情感词典的情感分析"""
    
    def __init__(self):
        self.pos_dict = ['好用', '喜欢', '赞', '流畅', '给力', '推荐', '满意']
        self.neg_dict = ['垃圾', '难用', '卡顿', '崩溃', '失望', 'bug', '问题']
        self.adv_dict = {'很': 1.5, '非常': 2.0, '太': 1.8, '不': -1.0}
    
    def analyze(self, text):
        """分析文本情感"""
        words = jieba.lcut(text)
        score = 0
        
        for i, word in enumerate(words):
            base_score = 0
            if word in self.pos_dict:
                base_score = 1
            elif word in self.neg_dict:
                base_score = -1
            
            if base_score != 0:
                # 考虑前面的程度副词
                if i > 0 and words[i-1] in self.adv_dict:
                    score += base_score * self.adv_dict[words[i-1]]
                else:
                    score += base_score
        
        if score > 0:
            return '正面'
        elif score < 0:
            return '负面'
        else:
            return '中性'
            
    def run_demo(self):
        """运行演示"""
        test_cases = [
            "这款造价软件非常好用，计算速度很快！",
            "更新后总是崩溃，太失望了。",
            "软件界面有点复杂，但是功能很全。",
            "我不喜欢这个新功能。"
        ]
        
        print("=== 基于情感词典的分析 ===")
        for text in test_cases:
            sentiment = self.analyze(text)
            print(f"文本: '{text}' -> 情感: {sentiment}")

# 运行词典法演示
dict_sentiment = DictionaryBasedSentiment()
dict_sentiment.run_demo()

优点：简单、快速、可解释性强。缺点：

词典覆盖度有限：无法覆盖所有情感词和网络新词。
无法处理复杂句式：如反讽、转折等。
领域相关性：通用词典在特定领域（如建筑）可能不适用。

2. 机器学习方法：让模型自己学

为了克服词典法的局限，我们转向机器学习。核心思想是：将情感分析看作一个文本分类问题。

TF-IDF + 逻辑回归/SVM

这是最经典的组合。我们用TF-IDF将文本转换为向量，然后用逻辑回归（Logistic Regression）或支持向量机（SVM）进行分类。

from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.svm import SVC
from sklearn.metrics import classification_report, confusion_matrix

class MachineLearningSentiment:
    """基于机器学习的情感分析"""
    
    def __init__(self):
        self.vectorizer = TfidfVectorizer(tokenizer=jieba.lcut, max_features=1000)
        self.model = None
    
    def train(self, texts, labels):
        """训练模型"""
        X = self.vectorizer.fit_transform(texts)
        X_train, X_test, y_train, y_test = train_test_split(X, labels, test_size=0.2, random_state=42)
        
        # 使用逻辑回归
        self.model = LogisticRegression(random_state=42)
        self.model.fit(X_train, y_train)
        
        # 评估模型
        y_pred = self.model.predict(X_test)
        print("=== 逻辑回归模型评估 ===")
        print(classification_report(y_test, y_pred))
        
        # 可视化混淆矩阵
        self.plot_confusion_matrix(y_test, y_pred, ['负面', '正面'])
        
    def plot_confusion_matrix(self, y_true, y_pred, labels):
        """绘制混淆矩阵"""
        cm = confusion_matrix(y_true, y_pred)
        plt.figure(figsize=(8, 6))
        sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', 
                    xticklabels=labels, yticklabels=labels)
        plt.title('混淆矩阵')
        plt.xlabel('预测标签')
        plt.ylabel('真实标签')
        plt.show()
        
    def predict(self, text):
        """预测新文本的情感"""
        if self.model is None:
            raise ValueError("模型未训练")
        
        X_new = self.vectorizer.transform([text])
        prediction = self.model.predict(X_new)
        return '正面' if prediction[0] == 1 else '负面'

# 运行机器学习方法演示
ml_sentiment = MachineLearningSentiment()

# 模拟标注数据
feedback_data = [
    ("软件很好用，推荐！", 1),
    ("功能强大，界面美观。", 1),
    ("计算结果准确，效率高。", 1),
    ("非常满意，解决了我的大问题。", 1),
    ("新版本太卡了，经常无响应。", 0),
    ("这个bug一直不修复，很失望。", 0),
    ("操作太复杂，学习成本高。", 0),
    ("价格太贵了，性价比不高。", 0),
    ("希望增加云同步功能。", 1), # 建议，偏正面
    ("为什么不能导入这种格式的文件？", 0) # 疑问，偏负面
]
texts, labels = zip(*feedback_data)

# 训练和评估
ml_sentiment.train(texts, labels)

# 预测新数据
print("\n=== 机器学习模型预测 ===")
new_feedback_1 = "虽然有点小贵，但功能确实强大，值了！"
new_feedback_2 = "一打开就闪退，根本没法用。"
print(f"'{new_feedback_1}' -> {ml_sentiment.predict(new_feedback_1)}")
print(f"'{new_feedback_2}' -> {ml_sentiment.predict(new_feedback_2)}")

优点：

自动学习特征：无需手动维护词典。
效果更好：能学习到词语的组合信息。
适应性强：只要有标注数据，就能适应特定领域。

缺点：

依赖标注数据：需要大量的人工标注。
可解释性差：难以解释为什么模型会做出某个判断。

3. 深度学习方法：更深层次的理解

深度学习模型，特别是循环神经网络（RNN/LSTM）和卷积神经网络（CNN），能更好地捕捉文本的序列信息和局部特征。

LSTM (Long Short-Term Memory)

LSTM非常适合处理序列数据（如文本），它能记住长距离的依赖关系，对于理解上下文至关重要。

import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, LSTM, Dense, SpatialDropout1D
from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.preprocessing.sequence import pad_sequences

class DeepLearningSentiment:
    """基于深度学习的情感分析"""
    
    def __init__(self, vocab_size=1000, max_length=50, embedding_dim=64):
        self.vocab_size = vocab_size
        self.max_length = max_length
        self.embedding_dim = embedding_dim
        
        self.tokenizer = Tokenizer(num_words=self.vocab_size, oov_token="<unk>")
        self.model = self._build_model()
    
    def _build_model(self):
        """构建LSTM模型"""
        model = Sequential([
            Embedding(self.vocab_size, self.embedding_dim, input_length=self.max_length),
            SpatialDropout1D(0.2),
            LSTM(64, dropout=0.2, recurrent_dropout=0.2),
            Dense(1, activation='sigmoid')
        ])
        model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])
        return model
        
    def prepare_data(self, texts, labels):
        """准备数据"""
        self.tokenizer.fit_on_texts(texts)
        sequences = self.tokenizer.texts_to_sequences(texts)
        padded_sequences = pad_sequences(sequences, maxlen=self.max_length, 
                                         padding='post', truncating='post')
        return padded_sequences, np.array(labels)

    def train(self, texts, labels, epochs=10):
        """训练模型"""
        X, y = self.prepare_data(texts, labels)
        X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
        
        history = self.model.fit(X_train, y_train, epochs=epochs, 
                                 validation_data=(X_test, y_test), 
                                 batch_size=4, verbose=2)
        return history
        
    def predict(self, text):
        """预测新文本"""
        sequence = self.tokenizer.texts_to_sequences([text])
        padded_sequence = pad_sequences(sequence, maxlen=self.max_length, 
                                        padding='post', truncating='post')
        prediction = self.model.predict(padded_sequence)
        return '正面' if prediction[0][0] > 0.5 else '负面'

# 运行深度学习方法演示
dl_sentiment = DeepLearningSentiment()

# 使用与ML相同的模拟数据
dl_sentiment.train(texts, labels, epochs=15)

print("\n=== 深度学习模型预测 ===")
new_feedback_1 = "这个软件的设计理念我很喜欢，希望能继续优化。"
new_feedback_2 = "客服回复太慢了，问题半天解决不了。"
print(f"'{new_feedback_1}' -> {dl_sentiment.predict(new_feedback_1)}")
print(f"'{new_feedback_2}' -> {dl_sentiment.predict(new_feedback_2)}")

广联达实战：多维度情感分析

在实际项目中，简单地将反馈分为“正面/负面”是远远不够的。我们需要一个更精细的分析框架。

我们的方案：

情感分类：首先，使用基于BERT的预训练模型进行三分类（正面、负面、中性/建议）。BERT能更好地理解语义，效果远超传统模型。
意图识别：对于负面反馈，识别其意图是Bug报告、功能吐槽还是价格抱怨。
对象提取：提取用户讨论的核心功能模块或对象（如“报表功能”、“CAD导图”、“云计价平台”）。
建立监控看板：将分析结果汇总到BI看板，实现：
- 功能模块健康度：实时监控各模块的负面反馈占比。
- 高频问题Top-N：自动聚合相似的负面反馈，定位核心问题。
- 用户流失风险预警：当某个用户连续发布多条负面反馈时，自动触发预警。

这个系统帮助产品和运营团队极大地提升了效率，使我们能更快地响应用户，更准地规划产品迭代。

总结：技术服务于业务

情感分析技术的演进，从词典、机器学习到深度学习，本质上是让机器越来越“懂”人类的语言。

从0到1：如果你需要快速实现一个情感分析功能，TF-IDF + 逻辑回归是一个性价比极高的选择。
从1到N：当你有足够的标注数据和计算资源，追求更高的准确率时，LSTM或基于BERT的模型是你的不二之选。
最终目标：真正的价值在于将技术与业务场景深度结合，构建多维度、可落地的分析系统，驱动业务决策。

至此，我2014-2018年的技术博客系列就全部完成了。从聚类、降维到SVM，再到NLP三部曲（智能客服、文本匹配、情感分析），希望这些结合了理论与实践的文章能对你有所启发。回顾这段经历，最大的收获是认识到技术是解决问题的工具，而深刻理解问题本身，才是创造价值的源泉。

感谢阅读！

背景：从“听到”到“听懂”​

1. 传统方法：情感词典​

2. 机器学习方法：让模型自己学​

TF-IDF + 逻辑回归/SVM​

3. 深度学习方法：更深层次的理解​

LSTM (Long Short-Term Memory)​

广联达实战：多维度情感分析​

总结：技术服务于业务​