RSS.Social

Santhosh Thottingal

follow: @[email protected]

Posts

CLI for transforming Wikipedia articles to text, markdown, and JSON

Preparing sentence dataset from a wikipedia

How to identify and annotate sentences in an HTML page

Rewriting the multilingual sentence segmenter - sentencex - in Rust

From Tokens to Text: A Trigram Markov Model for Malayalam

From Tokens to Text: A Trigram Markov Model for Malayalam

The Broken Token: Tokenization for Malayalam Language Models

Variable interpolatable smooth curves and outlines

svg2glif Rust library

Talk - "How AI learns Malayalam"

Malayalam Morphology Analyzer Now Available as a Rust Crate

WQ42: Grounding LLMs in Wikidata Facts via Tool Calling

qrender: Render wikidata item in different formats

Upskill and Upgrade

qjson: Fetching all properties of a wikidata item in a single API call

An Experiment in Detecting Wikipedia Edit Policy Violations with LLMs

Natural Language based question answering system for Wikipedia and Wikidata

Year 2024 in Review

Grapholinguistics 2024

Teaching AI in Schools

നിർമിതബുദ്ധി കിയോസ്കുകൾ

MetaPost sandbox

Book Review - Tamil Computing By Dr. R. Ponnusamy

Concerns on using AI in classrooms

മലയാളത്തിന്റെ ഡിജിറ്റൽ സൗന്ദര്യം - പ്രഭാഷണം

നിർമിതിബുദ്ധി മാതൃകകളിലെ മലയാളം - പ്രഭാഷണം

Year 2023

Typoday 2023

Correspondence with Kerala State Commission for Protection of Child Rights

ആം ചിഹ്നം ഫോണ്ടുകളിൽ

MetaPost previewer

Wikimania 2023

sentencex: Empowering NLP with Multilingual Sentence Extraction

Natural language question answering in Wikipedia - an exploration - Part 4

Natural language question answering in Wikipedia - an exploration - Part 3

Natural language question answering in Wikipedia - an exploration - Part2

Natural language question answering in Wikipedia - an exploration

Introducing Nupuram, new Malayalam typeface

Gayathri 1.20 released

ലിപിപരിഷ്കരണം 2022

ബഹുവചനമില്ലാത്ത ദേശാഭിമാനി

Hyphenation of Indian languages

Using Manjari as new orthography Malayalam font

One million Wikipedia articles by translation

New version of Malayalam morphology analyser

New version of Stuttgart Finite State Transducer

New version of Manjari Typeface released

Tesseract OCR web interface

Fixing a bug in Malayalam ya, ra, va sign rendering

English Malayalam Translation using OpusMT

Web application for learning Malayalam writing

Animated SVGs for learning Malayalam writing

A spellchecker webservice supporting 90 languages

Digital garden

Foreign word detection in mlmorph

What is a good input method?

Stuttgart Finite State Transducer(SFST) formalism support for VS Code

Opentype feature file support for VS Code

Malayalam Spellchecker version 1.1.1 released

Manjari version 1.910 released

Tamil Computing Virtual Meetup

Manjari - 4th anniversary

Manjari version 1.810 released

Morphology analyser based spellchecker - Web version

Video interviews on SMC and FOSS

ഡിജിറ്റൽ സാക്ഷരതാ പദ്ധതി

Life in the time of lockdown

Manjari version 1.800 released

Chilanka font version 1.500 released

Procrustes Analysis Based Handwriting Recognition

Professional student summit 2020

POS Tagging: A review of BIS POS tagset and ILCI-II Malayalam Text Corpus

Mlmorph at MT Summit 2019

Presidential award for contributions to Malayalam

Root Zone Label generation rules for Malayalam released

Markov chain for Malayalam

Updated web interface for mlmorph

Chilanka version 1.400 released

Lexicon Curation for Mlmorph

LibreOffice Malayalam spellchecker using mlmorph

Malayalam Named Entity Recognition using morphology analyser

Scribus gets hyphenation support for 11 Indian languages

Gayathri – New Malayalam typeface

How to setup DNS over TLS using systemd-resolved

വിക്കിപീഡിയയ്ക്ക് പതിനെട്ട്. നാലുലക്ഷം തർജ്ജമകളും

Swanalekha input method now available for Windows and Mac

പത്തുവർഷത്തെ കോഡ്

Malayalam morphology analyser – First release

Malayalam Script LGR rules for public review

Malayalam spellchecker – a morphology analyser based approach

Malayalam morphology analyser – status update

How to customize Malayalam fonts in Linux

യുവാക്കളുടെ തൊഴിലഭിമാനവും തൊഴിൽ സൊസൈറ്റികളും

The many forms of ചിരി ☺️

How to type Malayalam using Keyman 10 and Mozhi

Kindle supports custom fonts

Talk on ‘Malayalam orthographic reforms’ at Grafematik 2018

u and uː vowel signs of Malayalam

Typoday 2018

Applied Malayalam Computing

Applied Malayalam Computing

Manjari 1.5 version released

മലയാളത്തിലെ ‘ഉ’കാര ചിഹ്നങ്ങൾ

Stylistic Alternates for ച്ച, ള്ള in Manjari and Chilanka fonts

Number spellout and generation in Malayalam using Morphology analyser

Towards a Malayalam morphology analyser

Eureka magazine with Manjari font

Indesign CC automatic hyphenation for Indian languages

Scribus gets Malayalam Hyphenation support

Trufont now has SVG paste, drag and drop support

മഞ്ജരി ഫോണ്ട് – പതിപ്പ് 1.3

മലയാളം അകാരാദിക്രമം

പുതിയൊരു മലയാളം ഫോണ്ട് നിർമിക്കുന്നതെങ്ങനെ?

ദൈവങ്ങളുടെ ദ്വീപിൽ ഒരു ഇടവേള

It is your language and your pen

Malayalam collation updates in Glibc

Anniversary of Manjari font release

ദൃൿസാക്ഷി

യൂണിക്കോഡ് പത്താം പതിപ്പ്: മലയാളത്തിന് മൂന്നു പുതിയ കോഡ്പോയിന്റുകൾ കൂടി

A formal grammar for Malayalam syllables

A formal grammar for Malayalam conjunct

On Kerala IT Policy Draft 2017

Libreoffice Malayalam Hyphenation

നമ്മളെല്ലാം നമ്മളല്ലാതാവുന്ന കാലം

ഇമോജികളും ചില്ലക്ഷരങ്ങളും തമ്മിലെന്തു്?

സാങ്കേതികവിദ്യാഭ്യാസം : പരീക്ഷകളിങ്ങനെ മതിയോ?

മഹാഭാരതപ്രഭാഷണപരമ്പര – സുനിൽ പി ഇളയിടം

Detailed font reports using fontreport tool

Swanalekha input method documentation

2016 ൽ വായിച്ച പുസ്തകങ്ങൾ

Electronic Design and Automation Lab: Migration to Scilab

കേരളപ്പിറവിയുടെ അറുപതാം വാർഷികം – മനോരമ പത്രത്തിലെഴുതിയ കുറിപ്പ്

Proposal for Malayalam language subtags for orthography variants rejected

Manjari Font

A short story of one lakh Wikipedia articles

FOSS migration of electronic circuit simulation lab

ഡോക്ടർ ബി എം ഹെഗ്ഡേ – മാതൃഭൂമി ആഴ്ചപ്പതിപ്പിൽ വന്ന അഭിമുഖത്തെപ്പറ്റി

Activities

Activities

About Kavya

About Kavya

When Breath Becomes Air – Paul Kalanithi

Gujarat Files – Rana Ayyub

Introductory Workshop on Version Control Systems

Feedback on KTU Syllabus of Electronics and Communication Engineering

Internationalized Top Level Domain Names in Indian Languages

Redesigned font download page of SMC

Fontconfig language matching

Indic hyphenation patterns relicensed

Experimenting eSim- A tool for Electronic Circuit Simulation

അധിക നിമിഷം (Leap second)

Translating HTML content using a plain text supporting machine translation engine

Making of Keraleeyam font: From ASCII to Unicode

New handwriting style font for Malayalam: Chilanka

HOWTO: Wacom Bamboo CTH301K in Debian

Talk at Wikimania 2014

Updated Swanalekha JavaScript Library

Video of our presentation from 7th Multilingual Workshop by W3C

Typesetting Malayalam using XeTeX

Malayalam typing using Inscript in Ubuntu 14.04

How to install and configure swanalekha in Ubuntu 14.04

Frequency modulation in gnu-octave : square wave carrier and sinusoidal message

GSOC 2014 – Mentoring for SMC

Parsing CLDR plural rules in javascript

Browser language preferences: navigator.languages is coming

W3C Workshop at Madrid

A laboratory manual for basic analog communication experiments

Meera Tamil font in Ubuntu Trusty Tahr

Configurable node logger with winston

Mediawiki moves to json based localisation file format

Brackets, my favorite javascript IDE

NotoSansMalayalam and nta

Spurious glyphs in NotoSansMalayalam

Collaboratively edited documentation for Indic font developers

Hyphenation in web

New version of Malayalam fonts released

SVG Fonts

Malayalam Wikisource Offline version

Mediawiki Berlin hackathon

Creating a new Language ecosystem- Sourashtra as example

Cross Language Approximate Search on Indic Languages- A demo

Tamil Collation in GLIBC

Identifiers In Indic Languages

Dictionary Jabber Buddy Bots

Indic Language Computing Workout, Pune

Wikimania 2010, Poland

Attending Wikimania 2010

Malayalam Wikipedia releases selected articles on CD

Predictive text entry with ibus

Conferences : FOSS.IN and NCIDEEE

Inkscape hyphenation extension

New Hyphenation Pattern Extensions for Openoffice

Project Silpa Updates

Phonetic Comparison Algorithm for Indian Languages

On Machine Translation and God

PDFBox : Extract Text from PDF

Announcing Project Silpa

About Santhosh

About Santhosh

Openoffice Indic Regional Language group

In solidarity

“ക്ടാവ്” Slang converter തയാറാവുന്നു

Python isalpha is buggy

N-gram Visualization Experiment

Localization: What are we missing?

Updates…

മലയാളം അകാരാദിക്രമം

KDE Indic Screensavers

Hyphenation of Indian Languages in Webpages

Hyphenation of Indian Languages and Openoffice

Yahoo search bug

KDE spellchecker not working for Indian Languages

Youtube to MPEG or Ogg video conversion

Dhvani 0.94 Released

Language Detection and Spellcheckers

Gedit plugin for showing unicode codepoints

Screensavers in your language

Swanalekha M17N based Input Method for 11 Languages

സോഫ്റ്റ്‌വേര്‍ സ്വാതന്ത്ര്യദിനാഘോഷം 2008: ഭാഷാ കമ്പ്യൂട്ടിങ്ങ് സെമിനാറും ഇന്‍സ്റ്റാള്‍ ഫെസ്റ്റും

Geo-visualisation, the FOSS way

UTF8Decoder

Say NO to Software Patents

കെ.ഡി.ഇ. 4.1 പുറത്തിറങ്ങി

say_namaskaar.c

Dhvani Now Speaks Marathi

Canonical Equivalence in Unicode: Some notes

Firefox spellcheck bugs…

Apt on the Road

10 GB /var/log/messages file

Linux Kernel in Linux Operating System.

Bug in Firefox Spellcheck

മലയാളം, യൂണീകോഡ് 5.1, ഫോണ്ടുകള്‍…

Open Letter to Mammootty from Free Software Community

Using Inkscape for DTP in Indic Scripts

പേജ് ലേയൗട്ട് യൂണിക്കോഡ് മലയാളത്തില്‍

നിങ്ങള്‍ക്കു വേണ്ടി ധ്വനി സംസാരിയ്ക്കും.

ധ്വനി-കെ.ഡി.ഇ സംയോജനം

Can’t Speak? Dhvani will speak for you!

Dhvani – KDE Integration.

ഗ്നോം 2.22 പുറത്തിറങ്ങി.

GNOME 2.22 Released

ബഷീറിന്റെ മാന്ത്രികപ്പൂച്ച ധ്വനി വായിച്ചപ്പോള്‍

സ്വനലേഖ ബുക്ക്‌മാര്‍ക്ക്‌ലെറ്റ്

കൃഷ്ണകാന്ത് മനേ എന്ന അന്ധപ്രോഗ്രാമ്മര്‍

Creating audio books using Dhvani

FOSS India Awards

ആണവചില്ലും സ്പൂഫിങ്ങും

വേഗനിയന്ത്രണത്തിനായി പുതിയൊരു മാര്‍ഗ്ഗം!

മൈക്രോസോഫ്റ്റാണോ വലിയ ചെകുത്താന്‍?

കല കലയ്ക്കു് വേണ്ടിയോ?

കെ.ഡി.ഇ. 4.0 പുറത്തിറങ്ങി

നോ സ്ത്രീ സ്വാതന്ത്ര്യമര്‍ഹതി?!

നിഘണ്ടുക്കള്‍ ഗ്നു/ലിനക്സില്‍

Hackers or Crackers?

ബന്ധുക്കളെയറിയാന്‍ സ്വതന്ത്രസോഫ്റ്റ്‌വെയര്‍

വരികള്‍ നഷ്ടപ്പെടുന്ന പാട്ടുകള്‍

ഗ്നു/ലിനക്സില്‍ നിന്നു് ബ്ലോഗെഴുതാന്‍

Pirated Softwares: MS Raid In Kerala

ഓരോ കുട്ടിയ്ക്കും ഓരോ ലാപ്‌‌ടോപ്പ്

മലയാളം നിവേശകരീതികള്‍ ഒരു വിശകലനം

കേള്‍വി ഒരു കല, സംഭാഷണം സംഗീതവും

Sulekha: Transliteration Based Indic Texteditor

ഇതാ വരുന്നൂ, സുലേഖ

Hacking the GLMatrix screensaver

വരമൊഴിയിലും മൊഴി കീമാനിലും എന്‍കോഡിങ്ങ് ബഗ്ഗുകള്‍

സ്വതന്ത്ര മലയാളം കമ്പ്യൂട്ടിങ്ങ്, GSOC Mentor Summit ല്‍ പങ്കെടുക്കുന്നു.

കമ്പ്യൂട്ടറിന് മലയാളം പറഞ്ഞാല്‍ മനസ്സിലാകുമോ?

മലയാളത്തിന് സ്വന്തമായി ഒരു വേര്‍ഡ് പ്രൊസസ്സര്‍

ഗ്നോം 2.20 ലക്കത്തില്‍ മലയാളം ഔദ്യോഗികമായി ചേര്‍ക്കപ്പെട്ടു.

സ്വതന്ത്ര സോഫ്റ്റ്‌വെയറും മലയാളം കമ്പ്യൂട്ടിങ്ങും: സോഫ്റ്റ്‌വെയര്‍ സ്വാതന്ത്യ ദിനാഘോഷം

Aspell Malayalam Spelling checker Version 0.01-1 Released

ചില്ലും മലയാളം കമ്പ്യൂട്ടിങ്ങും

Matrix Digital Rain Screensaver In Malayalam!!!

മലയാളം സ്പെല്ലിങ്ങ് ചെക്കര്‍ പണിപ്പുരയില്‍

സ്വനലേഖയുടെ പുതിയ പതിപ്പ് പുറത്തിറങ്ങി.

Scim malayalam phonetic input method With Lookup table!!!

Scim malayalam phonetic input method : Key mapping

Scim malayalam phonetic input method

Malayalam Spellchecker

Dhvani rewrite

Only Aspell, no space for others…

A myth called the Indian programmer

Spell checker and Late night coding..

Plus meet May 2007 at Tippus Fort , Palakkad

Free software Alternatives or replacements

Debian Installer Etch Release Candidate 2 released

Dhvani Indian Language Text to Speech system

Swathanthra Malayalam Computing is participating in Google Summer of Code.

Archive

Search