首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >词向量可视化--[tensorflow , python]

词向量可视化--[tensorflow , python]

作者头像
Gxjun
发布于 2018-12-28 08:56:53
发布于 2018-12-28 08:56:53
1.8K00
代码可运行
举报
文章被收录于专栏:mlml
运行总次数:0
代码可运行
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
#!/usr/bin/env python
# -*- coding: utf-8 -*-
"""
----------------------------------
Version    : ??
File Name :     visual_vec.py
Description :   
Author  :       xijun1
Email   :
Date    :       2018/12/25
-----------------------------------
Change Activiy  :   2018/12/25
-----------------------------------

"""
__author__ = 'xijun1'
from tqdm import tqdm
import numpy as np
import tensorflow as tf
from tensorflow.contrib.tensorboard.plugins import projector
import os
import codecs

words, embeddings = [], []
log_path = 'model'

with codecs.open('/Users/xxx/github/python_demo/vec.txt', 'r') as f:
    header = f.readline()
    vocab_size, vector_size = map(int, header.split())
    for line in tqdm(range(vocab_size)):
        word_list = f.readline().split(' ')
        word = word_list[0]
        vector = word_list[1:-1]
        if word == "":
            continue
        words.append(word)
        embeddings.append(np.array(vector))
assert len(words) == len(embeddings)
print(len(words))

with tf.Session() as sess:
    X = tf.Variable([0.0], name='embedding')
    place = tf.placeholder(tf.float32, shape=[len(words), vector_size])
    set_x = tf.assign(X, place, validate_shape=False)
    sess.run(tf.global_variables_initializer())
    sess.run(set_x, feed_dict={place: embeddings})
    with codecs.open(log_path + '/metadata.tsv', 'w') as f:
        for word in tqdm(words):
            f.write(word + '\n')

    # with summary
    summary_writer = tf.summary.FileWriter(log_path, sess.graph)
    config = projector.ProjectorConfig()
    embedding_conf = config.embeddings.add()
    embedding_conf.tensor_name = 'embedding:0'
    embedding_conf.metadata_path = os.path.join('metadata.tsv')
    projector.visualize_embeddings(summary_writer, config)

    # save
    saver = tf.train.Saver()
    saver.save(sess, os.path.join(log_path, "model.ckpt"))

结果:

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2018-12-25 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
TensorFlow-7-TensorBoard Embedding可视化
学习资料 https://www.tensorflow.org/get_started/summaries_and_tensorboard 今天来看 TensorBoard 的一个内置的可视化工具 Embedding Projector, 是个交互式的可视化,可用来分析诸如 embeddings 的高维数据。 embedding projector 将从你的 checkpoint 文件中读取 embeddings。 默认情况下,embedding projector 会用 PCA 主成分分析方法将高维
杨熹
2018/04/03
1.8K0
TensorFlow-7-TensorBoard Embedding可视化
一文教你实现skip-gram模型,训练并可视化词向量
在本教程中,我将展示如何在Tensorflow中实现一个Word2Vec(Word2Vec是从大量文本语料中以无监督的方式学习语义知识的一种模型,它被大量地用在自然语言处理中)的skip-gram模型,为你正在使用的任何文本生成词向量,然后使用Tensorboard将它们可视化。 我在text8数据集上训练了一个skip-gram模型。然后,我用Tensorboard来设想这些Embedding,Embedding其实就是一个映射,将单词从原先所属的空间映射到新的多维空间中,也就是把原先词所在空间嵌入到一个
AiTechYun
2018/03/06
2K0
一文教你实现skip-gram模型,训练并可视化词向量
TensorFlow实现Attention机制原理介绍论文阅读代码实现
原理介绍 图片1 图片2 图片3 更多资料: https://distill.pub/2016/augmented-rnns/#attentional-interfaces https://
致Great
2018/06/13
8.8K0
利用RNN和LSTM生成小说题记
一、选取素材 本文选取的小说素材来自17k小说网的一篇小说《两只橙与遠太郎》,手工复制小说中的题记。 小说网址:http://www.17k.com/list/2793873.html 训练语料如下
两只橙
2018/04/28
9930
利用RNN和LSTM生成小说题记
tensorflow(四十八): 使用tensorboard可视化训练出的文本embedding
对应 tensorflow 1.15版本 log_dir = "./logdir" metadata_path = os.path.join(log_dir, 'metadata.csv') names = ["苹果", "香蕉"] embs = [[1.0, 2.0, 0.1, 0.4], [1.0, 1.0, 0.1, 0.4]] # 1. 写 metadata.csv. 这里存的是对应的 embedding的 文本 with open(metadata_path, "w") as f:
ke1th
2022/10/04
2610
【NLP实战】手把手带你fastText文本分类
今天的教程是基于FAIR的Bag of Tricks for Efficient Text Classification[1]。也就是我们常说的fastText。
yuquanle
2020/03/13
2.9K0
tensorboard快速上手教程
tensorboard可对网络和各种参数进行可视化,可以方便的进行网络结构调整和调参,尤其是应对复杂网路,下面用一个例子介绍tensorboard在Linux中的使用方法。
狼啸风云
2019/01/18
1.9K0
tensorflow版本的tansformer训练IWSLT数据集
代码来源:https://github.com/Kyubyong/transformer
西西嘛呦
2020/08/26
2K0
图解人脸识别算法facenet系列(一)
代码地址:https://github.com/davidsandberg/facenet
算法发
2020/08/03
2.6K0
图解人脸识别算法facenet系列(一)
猪年快乐之TensorFlow中实现word2vec及如何结构化TensorFlow模型
猪年快乐之TensorFlow中实现word2vec及如何结构化TensorFlow模型
公众号guangcity
2019/09/20
1.2K0
猪年快乐之TensorFlow中实现word2vec及如何结构化TensorFlow模型
paddlepaddle如何预加载embedding向量
使用小批量数据时,模型容易过拟合,所以需要对全量数据进行处理,我是用的是word2vec训练的词向量. 那么训练好对词向量如何加载呢?
Gxjun
2019/12/10
1K0
【深入研究】使用RNN预测股票价格系列二
接昨天的 系列一(可点击查看) 在系列一的教程中,我们想继续有关股票价格预测的主题,并赋予在系列1中建立的具有对多个股票做出响应能力的RNN。 为了区分不同价格序列之间相关的模式,我们使用股票信号嵌入
量化投资与机器学习微信公众号
2018/01/29
1.5K0
【深入研究】使用RNN预测股票价格系列二
Tensorboard 高维向量可视化
[1]Tensorflow实战Google深度学习框架: https://github.com/caicloud/tensorflow-tutorial/tree/master/Deep_Learning_with_TensorFlow/1.4.0
演化计算与人工智能
2020/08/14
1.6K0
Tensorboard 高维向量可视化
tf25: 使用深度学习做阅读理解+完形填空
本文介绍了如何使用深度学习来做阅读理解+完形填空。首先介绍了TensorFlow的基本用法,然后详细讲解了如何使用TensorFlow来实现这个任务。主要包括两个部分:1. 使用深度学习来做阅读理解;2. 使用深度学习来做完形填空。最后还给出了一些实验结果和性能指标。
MachineLP
2018/01/09
2.3K0
tf25: 使用深度学习做阅读理解+完形填空
【深度学习】写诗机器人tensorflow实现
代码地址:https://github.com/hjptriplebee/Chinese_poem_generator, 欢迎fork, star 机器人命名MC胖虎,目前只是最简单粗暴的方法,使用t
triplebee
2018/03/27
3.9K0
【深度学习】写诗机器人tensorflow实现
[TensorFlow深度学习深入]实战三·分别使用DNN,CNN与RNN(LSTM)做文本情感分析(机器如何读懂人心)
不太清楚的可以回顾我们之前的博文。 使用了全连接,卷积神经网络与循环神经网络分别实现了. 代码部分: 1.全连接实现
小宋是呢
2019/06/27
6510
TF入门05-实验过程管理
TensorBoard中Word2Vec模型计算图表示如图,如果模型更复杂,计算图也越来越乱,我们可以使用name scope将相关的结点放到一个组里来方便运算图的理解。tf.name_scope使用如下:
公众号-不为谁写的歌
2020/07/23
8890
基于tensorflow的bilstm_crf的命名实体识别(数据集是msra命名实体识别数据集)
github地址:https://github.com/taishan1994/tensorflow-bilstm-crf
西西嘛呦
2020/11/24
1.3K0
基于tensorflow的bilstm_crf的命名实体识别(数据集是msra命名实体识别数据集)
流水账︱Elmo词向量中文训练过程杂记
参考:《文本嵌入的经典模型与最新进展》 人们已经提出了大量可能的词嵌入方法。最常用的模型是 word2vec 和 GloVe,它们都是基于分布假设的无监督学习方法(在相同上下文中的单词往往具有相似的含义)。
悟乙己
2019/05/26
2.5K0
Tensorboard详解(下篇)
编辑 | 磐石 出品 | 磐创AI技术团队 【磐创AI导读】:本文接续Tensorboard详解(上篇)介绍Tensorboard和总结Tensorboard的所有功能并有代码演练。欢迎大家点击上方蓝字关注我们的公众号:磐创AI。 1. Tensorflow监控指标可视化 除了GRAPHS栏目外,tensorboard还有IMAGES、AUDIO、SCALARS、HISTOGRAMS、DISTRIBUTIONS、FROJECTOR、TEXT、PR CURVES、PROFILE九个栏目,本小节将详细介绍这些
磐创AI
2018/07/03
1.9K0
推荐阅读
相关推荐
TensorFlow-7-TensorBoard Embedding可视化
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验