forked from tyroroto/ThaiWord-Segmentation-.Net
-
Notifications
You must be signed in to change notification settings - Fork 0
Home
Chaiwat Matarak edited this page Jan 4, 2020
·
1 revision
using System;
using System.Collections.Generic;
using ThaiStringTokenizer;
public void SplitWord()
{
var tokenizer = new ThaiTokenizer();
var text = "ปลาที่ใหญ่ที่สุดในโลกคือปารีสชุบแป้งทอด";
var results = tokenizer.Split(text);
Console.WriteLine("results = [{0}]", string.Join('|', results));
// results = [ปลา|ที่|ใหญ่|ที่สุด|ใน|โลก|คือ|ปารีส|ชุบ|แป้ง|ทอด]
}using System;
using System.Collections.Generic;
using ThaiStringTokenizer;
public void SubstringThaiStyle()
{
var tokenizer = new ThaiTokenizer();
var text = "ปลาที่ใหญ่ที่สุดในโลกคือปารีสชุบแป้งทอด";
var maxLenght = 20;
var result = tokenizer.SubThaiString(text, maxLength);
Console.WriteLine("results = [{0}]", string.Join('|', results));
// results = [ปลาที่ใหญ่ที่สุดในโลกคือ|ปารีสชุบแป้งทอด]
}using System;
using System.Collections.Generic;
using ThaiStringTokenizer;
using ThaiStringTokenizer.Models;
public void SubstringThaiStyle()
{
var input = "ถ้าหากรักนี้ ไม่บอกไม่พูดไม่กล่าว แล้วเขาจะรู้ว่ารักหรือเปล่า";
var tokenizer = new ThaiTokenizer();
var results = tokenizer.SubThaiStringAndCount(input, 24);
foreach (var result in results) {
Console.WriteLine("word = {0}, countable = {1}, uncountable = {2}", result.Words, result.Countable, result.Uncountable);
}
// Words = ถ้าหากรักนี้ ไม่บอกไม่พูดไม่กล่าว, Countable = 24, Uncountable = 9
// Words = แล้วเขาจะรู้ว่ารักหรือเปล่า, Countable = 21, Uncountable = 7
}using System;
using System.Collections.Generic;
using ThaiStringTokenizer;
public void SplitWord()
{
var customDictionary = new List<string> { "หวัดดี", "หวักลี", "เชอแตม" };
var tokenizer = new ThaiTokenizer(customDictionary);
var text = "หวักลีหวัดดีปลาที่ใหญ่ที่สุดในโลกคือปารีสชุบแป้งทอดเชอแตม";
var results = tokenizer.Split(text);
Console.WriteLine("results = [{0}]", string.Join('|', results));
// results = [หวักลี|หวัดดี|ปลา|ที่|ใหญ่|ที่สุด|ใน|โลก|คือ|ปารีส|ชุบ|แป้ง|ทอด|เชอแตม]
}using System;
using System.Collections.Generic;
using ThaiStringTokenizer;
public void SubstringThaiStyle()
{
var tokenizer = new ThaiTokenizer();
var text = "อาราธนาพระพุทธ อาราธนาพระธรรม อาราธนาพระสงฆ์";
var maxLenght = 50;
var results = tokenizer.SubThaiString(text, maxLength);
Console.WriteLine("results = [{0}]", string.Join('|', results));
// results = [อาราธนาพระพุทธ อาราธนาพระธรรม อาราธนาพระสงฆ์]
}using System;
using System.Collections.Generic;
using ThaiStringTokenizer;
public void SplitWord()
{
var tokenizer = new ThaiTokenizer(matchingTechnique: MatchingTechnique.ShortestMatching);
var text = "เจริญ";
var results = tokenizer.Split(text);
Console.WriteLine("results = [{0}]", string.Join('|', results));
// results = [เจ|ริญ]
}using System;
using System.Collections.Generic;
using ThaiStringTokenizer;
public void SplitWord()
{
var tokenizer = new ThaiTokenizer(matchingTechnique: MatchingTechnique.LongestMatching);
var text = "เจริญ";
var results = tokenizer.Split(text);
Console.WriteLine("results = [{0}]", string.Join('|', results));
// results = [เจริญ]
}using System;
using System.Collections.Generic;
using ThaiStringTokenizer;
public void SplitWord()
{
var tokenizer = new ThaiTokenizer(matchingTechnique: MatchingTechnique.ShortestMatching);
var text = "ศิริวิมล";
var results = tokenizer.Split(text);
Console.WriteLine("results = [{0}]", string.Join('|', results));
// results = [ศิ|ริ|วิ|มล]
}