<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Advances in Cognitive Sciences</title>
<title_fa>تازه های علوم شناختی</title_fa>
<short_title>Advances in Cognitive Sciences</short_title>
<subject>Literature &amp; Humanities</subject>
<web_url>http://icssjournal.ir</web_url>
<journal_hbi_system_id>1</journal_hbi_system_id>
<journal_hbi_system_user>admin</journal_hbi_system_user>
<journal_id_issn>1561-4174</journal_id_issn>
<journal_id_issn_online>2783-073x</journal_id_issn_online>
<journal_id_pii></journal_id_pii>
<journal_id_doi>10.30514/icss</journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid></journal_id_sid>
<journal_id_nlai></journal_id_nlai>
<journal_id_science></journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1399</year>
	<month>3</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2020</year>
	<month>6</month>
	<day>1</day>
</pubdate>
<volume>22</volume>
<number>2</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>fa</language>
	<article_id_doi></article_id_doi>
	<title_fa>ارزیابی هیجان ضمن پیام از طریق پردازش گفتار هیجانی مبتنی بر استفاده از ویژگی‌های MFCC و STFT</title_fa>
	<title>Evaluation of implicit emotion in the message through emotional speech processing based on Mel-Frequency Cepstral Coefficient and Short-Time Fourier Transform features</title>
	<subject_fa>مدل سازی شناختی، پردازش سیگنال و تصویربرداری مغز</subject_fa>
	<subject></subject>
	<content_type_fa>پژوهشي اصیل</content_type_fa>
	<content_type>Research</content_type>
	<abstract_fa>&lt;strong&gt;&lt;span style=&quot;font-family:B Titr;&quot;&gt;&lt;span style=&quot;font-size:12.0pt;&quot;&gt;مقدمه:&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;span style=&quot;font-family:B Nazanin;&quot;&gt;&lt;span style=&quot;font-size:12.0pt;&quot;&gt; گفتار مؤثرترین ابزاری است که انسان&#8204;ها برای انتقال اطلاعات از آن استفاده می&#8204;کنند. گوینده در خلال گفتار خویش علاوه بر واژگان و دستور زبان اطلاعاتی همچون سن، جنسیت و حالت&#8204; هیجانی خود را منتقل می&#8204;کند. پژوهش&#8204;های فراوانی با رویکردهای گوناگون پیرامون هیجان در گفتار هیجانی انجام شده است. این پژوهش&#8204;ها نشان می&#8204;دهند که هیجان ضمن پیام در گفتار هیجانی از طبیعتی پویا برخودار می&#8204;باشد. این پویایی، مطالعه&#8204; کمّی هیجان در گفتار هیجانی را با دشواری همراه می&#8204;سازد. این پژوهش به ارزیابی هیجان ضمن پیام از طریق پردازش گفتار هیجانی با استفاده از ویژگی&#8204;های ضرایب کپسترال فرکانس مِل (&lt;/span&gt;&lt;/span&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-family:Times New Roman,serif;&quot;&gt;MFCC&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-family:B Nazanin;&quot;&gt;&lt;span style=&quot;font-size:12.0pt;&quot;&gt;) و تبدیل فوریه زمان کوتاه (&lt;/span&gt;&lt;/span&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-family:Times New Roman,serif;&quot;&gt;STFT&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-family:B Nazanin;&quot;&gt;&lt;span style=&quot;font-size:12.0pt;&quot;&gt;) پرداخت. &lt;/span&gt;&lt;/span&gt;&lt;strong&gt;&lt;span style=&quot;font-family:B Titr;&quot;&gt;&lt;span style=&quot;font-size:12.0pt;&quot;&gt;&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;br&gt;
&lt;strong&gt;&lt;span style=&quot;font-family:B Titr;&quot;&gt;&lt;span style=&quot;font-size:12.0pt;&quot;&gt;روش کار:&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;span style=&quot;font-family:B Nazanin;&quot;&gt;&lt;span style=&quot;font-size:12.0pt;&quot;&gt; داده&#8204;های ورودی، پایگاه&#8204;داده&#8204; استاندارد گفتار هیجانی &lt;/span&gt;&lt;/span&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-family:Times New Roman,serif;&quot;&gt;Berlin&lt;/span&gt;&lt;/span&gt; &lt;span style=&quot;font-family:B Nazanin;&quot;&gt;&lt;span style=&quot;font-size:12.0pt;&quot;&gt;شامل هفت حالت هیجانی خشم، کسلی، انزجار، ترس، شادی، غم و حالت خنثی می&#8204;باشد. با استفاده از نرم افزار &lt;/span&gt;&lt;/span&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-family:Times New Roman,serif;&quot;&gt;MATLAB&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-family:B Nazanin;&quot;&gt;&lt;span style=&quot;font-size:12.0pt;&quot;&gt; ابتدا فایل&#8204;های صوتی خوانده شدند. در مرحله&#8204; بعد نخست ویژگی&#8204;های &lt;/span&gt;&lt;/span&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-family:Times New Roman,serif;&quot;&gt;MFCC&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-family:B Nazanin;&quot;&gt;&lt;span style=&quot;font-size:12.0pt;&quot;&gt; و سپس ویژگی&#8204;های &lt;/span&gt;&lt;/span&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-family:Times New Roman,serif;&quot;&gt;STFT&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-family:B Nazanin;&quot;&gt;&lt;span style=&quot;font-size:12.0pt;&quot;&gt; استخراج شدند. بردار&#8204;های ویژگی برای هر کدام از ویژگی&#8204;ها بر اساس هفت مقدار آماری کمینه، بیشینه، میانگین، انحراف معیار، میانه، چولگی و کشیدگی محاسبه شدند و به عنوان ورودی شبکه&#8204; عصبی مصنوعی مورد استفاده قرار گرفتند. در انتها، بازشناسی حالت&#8204;های هیجانی با استفاده از توابع آموزشی مبتنی بر الگوریتم&#8204;های مختلف انجام شد. &lt;/span&gt;&lt;/span&gt;&lt;br&gt;
&lt;strong&gt;&lt;span style=&quot;font-family:B Titr;&quot;&gt;&lt;span style=&quot;font-size:12.0pt;&quot;&gt;یافته&#8204;ها:&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;span style=&quot;font-family:B Nazanin;&quot;&gt;&lt;span style=&quot;font-size:12.0pt;&quot;&gt; نتایج بدست آمده نشان داد میانگین و صحت بازشناسی حالت&#8204;های هیجانی با استفاده از ویژگی&#8204;های &lt;/span&gt;&lt;/span&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-family:Times New Roman,serif;&quot;&gt;STFT&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-family:B Nazanin;&quot;&gt;&lt;span style=&quot;font-size:12.0pt;&quot;&gt; نسبت به ویژگی&#8204;های &lt;/span&gt;&lt;/span&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-family:Times New Roman,serif;&quot;&gt;MFCC&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-family:B Nazanin;&quot;&gt;&lt;span style=&quot;font-size:12.0pt;&quot;&gt; بهتر است. همچنین، حالت&#8204;های هیجانی خشم و غم از نرخ بازشناسی بهتری برخوردار بودند. &lt;/span&gt;&lt;/span&gt;&lt;br&gt;
&lt;strong&gt;&lt;span style=&quot;font-family:B Titr;&quot;&gt;&lt;span style=&quot;font-size:12.0pt;&quot;&gt;نتیجه&#8204;گیری:&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;span style=&quot;font-family:B Nazanin;&quot;&gt;&lt;span style=&quot;font-size:12.0pt;&quot;&gt; ویژگی&#8204;های &lt;/span&gt;&lt;/span&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-family:Times New Roman,serif;&quot;&gt;STFT&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-family:B Nazanin;&quot;&gt;&lt;span style=&quot;font-size:12.0pt;&quot;&gt; نسبت به ویژگی&#8204;های &lt;/span&gt;&lt;/span&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-family:Times New Roman,serif;&quot;&gt;MFCC&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-family:B Nazanin;&quot;&gt;&lt;span style=&quot;font-size:12.0pt;&quot;&gt;&amp;nbsp; هیجان ضمن پیام در گفتار هیجانی را بهتر بازنمایی می&#8204;کنند.&lt;/span&gt;&lt;/span&gt;</abstract_fa>
	<abstract>&lt;strong&gt;Introduction:&lt;/strong&gt; Speech is the most effective way to exchange information. In a speech, a speaker&amp;rsquo;s voice carries additional information other than the words and grammar content of the speech, i.e., age, gender, and emotional state. Many studies have been conducted with various approaches to the emotional content of speech. These studies show that emotion content in speech has a dynamic nature. The dynamics of speech make it difficult to extract the emotion hidden in a speech. This study aimed to evaluate the implicit emotion in a message through emotional speech processing by applying the Mel-Frequency Cepstral Coefficient (MFCC) and Short-Time Fourier Transform (STFT) features.&lt;br&gt;
&lt;strong&gt;Methods:&lt;/strong&gt; The input data is the Berlin Emotional Speech Database consisting of seven emotional states, anger, boredom, disgust, anxiety/fear, happiness, sadness, and neutral version. MATLAB software is used to input audio files of the database. Next, the MFCC and STFT features are extracted. Feature vectors for each method are calculated based on seven statistical values, i.e. minimum, maximum, mean, standard deviation, median, skewness, and kurtosis. Then, they are used as an input to an Artificial Neural Network. Finally, the recognition of emotional states is done by training functions based on different algorithms.&lt;br&gt;
&lt;strong&gt;Results:&lt;/strong&gt; The results revealed that the average and accuracy of emotional states recognized using STFT features are better and more robust than MFCC features. Also, emotional states of anger and sadness have a higher rate of recognition, among other emotions.&lt;br&gt;
&lt;strong&gt;Conclusion:&lt;/strong&gt; STFT features showed to be better than MFCC features to extract implicit emotion in speech.</abstract>
	<keyword_fa>گفتار هیجانی, بازشناسی هیجان, تبدیل فوریه کوتاه مدت, ضرایب کپسترال فرکانس مل, پردازش گفتار هیجانی</keyword_fa>
	<keyword>Emotional speech, Emotion recognition, Short time Fourier transform, Mel-frequency Cepstral coefficients, Emotional speech processing</keyword>
	<start_page>71</start_page>
	<end_page>81</end_page>
	<web_url>http://icssjournal.ir/browse.php?a_code=A-10-575-2&amp;slc_lang=fa&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>Mahsa</first_name>
	<middle_name></middle_name>
	<last_name>Ravanbakhsh</last_name>
	<suffix></suffix>
	<first_name_fa>مهسا</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>روانبخش</last_name_fa>
	<suffix_fa></suffix_fa>
	<email></email>
	<code>10031947532846009320</code>
	<orcid>10031947532846009320</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>PhD Student of Cognitive Linguistics, Institute for Cognitive Science Studies (ICSS), Tehran, Iran</affiliation>
	<affiliation_fa>دانشجوی دکتری زبان‌شناسی شناختی، موسسه آموزش عالی علومشناختی، تهران، ایران</affiliation_fa>
	 </author>


	<author>
	<first_name>Saeed</first_name>
	<middle_name></middle_name>
	<last_name>Setayeshi</last_name>
	<suffix></suffix>
	<first_name_fa>سعید</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>ستایشی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>Setayesh@aut.ac.ir</email>
	<code>10031947532846009321</code>
	<orcid>10031947532846009321</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation>Associate Professor of Department of Physics and Energy Engineering, Amirkabir University of Technology, Tehran, Iran</affiliation>
	<affiliation_fa>دانشیار گروه مهندسی هست8ه‌ای، دانشکده فیزیک و انرژی، دانشگاه صنعتی امیرکبیر، تهران، ایران</affiliation_fa>
	 </author>


	<author>
	<first_name>Mir Mohsen</first_name>
	<middle_name></middle_name>
	<last_name>Pedram</last_name>
	<suffix></suffix>
	<first_name_fa>میرمحسن</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>پدرام</last_name_fa>
	<suffix_fa></suffix_fa>
	<email></email>
	<code>10031947532846009322</code>
	<orcid>10031947532846009322</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Associate Professor, Department of Electrical and Computer Engineering, Kharazmi University, Tehran, Iran</affiliation>
	<affiliation_fa>دانشیار گروه مهندسی الکترونیک و کامپیوتر، دانشکده فنی و مهندسی، دانشگاه خوارزمی، تهران، ایران</affiliation_fa>
	 </author>


	<author>
	<first_name>Azadeh</first_name>
	<middle_name></middle_name>
	<last_name>Mirzaei</last_name>
	<suffix></suffix>
	<first_name_fa>آزاده</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>میرزایی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email></email>
	<code>10031947532846009323</code>
	<orcid>10031947532846009323</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Assistant Professor of Linguistics, Department of Linguistics, Faculty of Persian Literature and Foreign Languages, Allameh Tabataba'i University, Tehran, Iran</affiliation>
	<affiliation_fa>استادیار گروه زبان‌شناسی، دانشکده ادبیات و زبان‌های خارجی، دانشگاه علامه طباطبائی، تهران، ایران</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
